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(54) Bacteries lactiques produlsant des exopolysaccharides 

(57) Fragment d'ADN d'origine g^nomique codant 
pour au moins une enzyme impliqu6e dans la biosyn- 
thdse d'un EPS, et capable suite a la transformation 
d une baclerie lactique de restaurer la production d'un 
EPS dans ladite bacterie n'en produisant pas initiale- 
ment, ou de modifier la structure de I'EPS produrt initia- 
lement par ladite bacterie. Prolines de la souche 
Streptococcus thermophilus CNCM 1-1590 cod6es par 
le chromosome et qui sont impliqu6es dans la biosyn- 
th6se de I'EPS ayant fa composition Glc:Gal:Gal- 
Nac=1:2:1. Proc&te de fabrication d'un nouvel EPS, 
dans lequel on clone dans un vecteur un fragment 
d'ADN codant partiellement ou totalement pour au 
moins une enzyme impliquee dans la biosynthfcse d'un 
EPS, on transforme des bact6ries lactiques produisant 
un autre EPS par le vecteur recombinant, puis on s6lec- 
tionne une bacterie lactique produisant un nouvel EPS. 
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Description 

La presente invention se rapporte a I'utilisation de fragments d'ADN chromosomique de bacteries lactiques codant 
pour au moins une enzyme impliquee dans la biosynthese d'exopoly saccharides, ainsi que des enzymes codees par 
5 ces fragments. 

Etat de la technique 

II est connu que les bacteries lactiques sont susceptibles de produire dans leur milieu de culture deux classes de 
10 polysaccharides, a savoir les homopolysaccharides comme les dextranes ou les levanes qui sont constitues par 
I'assemblage r^pete d'un seul sucre, et les heteropolysaccharides appends communement exopolysaccharides ou 
EPS (EPS est I'abreviation du terme "exopolysaccharide") constitues par I'assemblage de plusieurs sucres differents 
formant une unite repetitive (Cerning J., Bacteries lactiques, Vol I, de Rossart H et Luquet F. M., Lorica, 309-329, 1994). 
Une bacterie lactique produisant un EPS peut conferer un caractere filant et/ou une texture lisse et cr6meuse a un 
is lait acidifie (Cerning et a/., FEMS Microbiol., 87, 113-130, 19/90). Les EPS peuvent aussi presenter des activites bio- 
logiques particulierement interessantes pour la sante humaine ou animate, comme des activity anti-tumeurs ou pro- 
biotiques, par exemple (Oda M. et a/., Agric. Biol. Chem., 4L 1623-1625, 1983; EP94870139.6) 

Par ailleurs, I'industrie est confrontee a une instability gen6tique de la biosynthese des EPS dans les bacteries lac- 
tiques. Ceci se traduit gen6ralement au cours d'une fermentation par la perte de la production d'EPS par tout ou partie 
20 des bacteries lactiques (voir "Cerning J." ci-dessus). Les produits fermentes industries sont ainsi sujets a des varia- 
tions dans leur contenu en EPS, ce qui n'est pas toujours acceptable. Pour remedier a ces problemes, I'industrie 
recours actuellement a I'isolation et la caracterisation periodique de ses bacteries de maniere a s6parer celles qui ont 
perdu leur caractere originel. 

La biosynthese d'EPS dans les bacteries lactiques mesophiles, c'est a dire les bacteries lactiques ayant une crois- 
25 sance optimale a 28-37°C, implique au moins une enzyme qui assure I'enchalnement des sucres. Aucun gene chromo- 
somique ou plasmidique de bacteries lactiques mesophiles codant pour une telle enzyme n'a encore 6t6 identifi6 et 
sequence, bien que Ton connaisse des plasmides impliqu6s dans la biosynthese cf EPS. 

WO 92/021 42 reveie ainsi I'existence du plasmide pHV67 qui produit dans Lactococcus lactis subsp. lactis (m6so- 
phile) une substance capable d'augmenter la viscosite d'un lait fermente. US5066588 decrrt deux plasmides provenant 
30 d'une souche de Streptococcus cremohs (mesophile) capable de conferer un caractere epaississant a un Streptococ- 
cus lactis. De m§me, Vescovo et a/, ont mis en Evidence un plasmide d'une souche Lactobacillus casei subsp. casei 
(mesophile) codant pour un phenotype Muc+, c'est a dire pour des fonctions Ii6es a la production d'6paississarrts exo- 
cellulaires (Vescovo era/., Biotechnology Letters, Vol II, 709-712, 1989). 

Enfin, Van den Berg et al. cherchent a isoler d'un Lactobacillus sake (mesophile) un groupe de genes chromoso- 
35 miques impliqu6s dans la biosynthese d'un EPS (Van den Berg D.J.C. et al. t First International Conference on Polysac- 
charide Engineering, Trondheim, Norway, June 6-8, 1994). Cependant aucun gene n'a encore ete identifie et/ou 
sequence. 

D'un autre cote, la biosynthese d'EPS dans les bacteries lactiques thermophiles, c'est a dire les bacteries lactiques 
ayant une croissance optimale a 37-45°C, n'est pas encore bien connue. On sait cependant qu'elle n'est pas associee 
40 a un plasmide. Vescovo et al. ont ainsi montre que le phenotype Muc+ de la souche Lactobacillus delbrueckii subsp 
bulgaricus 2o1 (thermophile) est lie a des fonctions chromosomiques (Vescoso et al., Biotechnology Letters, Vol II, 
709-712. 1989). 

Ainsi a ce jour, aucun gene ou groupe de genes chromosomiques ou plasmidiques codant pour un EPS de bacte- 
ries lactiques mesophiles ou thermophiles n'a ete identifie et/ou sequence. 
45 II serait done tres interessant d'avoir des moyens pour restaurer ou stabiliser la production originelle d'EPS dans 
les bacteries lactiques. De plus, il serait egalement interessant d'avoir des moyens pour modifier la structure d'un EPS, 
et creer de ce fait de nouveaux EPS pouvant avoir des proprietes interessantes. 

Resume de rinvention 

50 

L'invention se destine a fournir des nouveaux moyens pour controller, modifier et/ou restaurer la synthese d'EPS in- 

vivo et in-vitro. 

A cet effet, la pr6sente invention concerne tout ADN d'origine chromosomique de bacterie lactique codant pour au 
moins une enzyme impliquee dans la biosynthese de I'EPS presentant la structure r6p6t6e 
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->x>A-(l -> x)-A-(l ->x>A<l-> 

y 



ou n > 1 ; A est choisi dans le groupe form6 par p-D-Galp. p-D-Glcp et leurs d6riv6s acetyl et phosphatyl; et x et y = 2, 
3, 4, 5 ou 6 sachant que x * y. 

is Un autre objet de la pr6sente invention concerne les vecteurs recombinants comprenant un fragment d'ADN selon 
la pr6sente invention. 

Un autre objet de la pr&ente invention concerne une prot&ne susceptible d'etre impliqu6e dans la biosynthfcse de 
I'EPS ayant la structure r6p6t6e 

20 

->3)-p-D-Galp(l»>3)-p-D-Glcp(l»>3)-(i-D-GalpNAc(l"> 

6 



P -D-Gal/? 

ladite proline ayant la sequence en acides amines choisie dans le groupe form6 par les sequences SEQ ID NO:2, 3, 
4, 5, 6, 7, 8, 9, 10, 1 1, 12, 13, 14, et les s6quences homologues (sequences pr6sent6es dans la liste de 66quences ci- 
30 aprfcs). 

Un autre objet de la pr6sente invention concerne une bacterie lactique comprenant, integrS dans son chromosome 
ou par le moyen d'un plasmide r6plicable, un fragment d'ADN selon ['invention. 

Un autre objet de la pr6sente invention concerne un proc6d6 de production d'un EPS, dans lequel (1) on clone 
dans un vecteur un fragment d'ADN codant pour les enzymes selon l'invention, ledit vecteur comprenant en outre une 
35 sequence permettant la r6plication autonome ou Integration dans une cellule hdte, (2) on transforme une cellule h6te 
par ledit vecteur, (3) puis on cultive la cellule hGte transform6e dans des conditions approprtees pour la production d'un 
EPS. 

L'invention concerne aussi un autre proc6d6 de production d'un nouvel EPS dans lequel, (1) on clone dans un vec- 
teur un fragment d'ADN codant pour au moins une enzyme impliqu6e dans la biosynthfcse d un EPS, (2) on transforme 
40 une bacterie lactique par ledit vecteur, (3) puis on cultive la bacterie lactique transform6e dans des conditions appro- 
prices pour la production d'un nouvel EPS. 

La pr6sente invention ouvre done la possibility d'utiliser des fragments d'ADN selon (Invention pour restaurer ou 
modifier la production d'EPS dans une bact§rie lactique. On peut ainsi envisager d'exprimer ou de surexprimer dans 
une bact6rie lactique l expression des ADN selon l'invention, pour produire des EPS destines k 6paissir et rendre cr6- 
45 meux des boissons ou de la nourriture comme des desserts liquides, des yogourts, des soupes, des crimes glac6s, 
des crimes de caf6, des sauces ou des mayonnaises, par exemple. 

La pr6sente invention permet aussi d'avoir des moyens nouveaux pour identifier des gdnes chromosomiques de 
bact&ies lactiques impliqu6s dans la biosynth&se d'EPS. 

Enfin, la pr6sente invention fournie aussi de nouvelles enzymes impliqu6es dans la biosynthfcse de I'EPS d6crit ci- 
so dessus. Ces enzymes peuvent Stre ainsi avantageusement utilis6es pour synth6tiser ou modifier in-vitro un polysac- 
charide, comme un oligosaccharide ou un EPS, par exemple (Ichikawa Y. et aL, American Chemical Society, U4, 9283- 
9289, 1992). 

Pescriptjo-n des figures; 

55 

Figure 1 .A. Carte physique de l*op6ron impliqu6e dans la synthase de I'EPS de la souche S. thermophilus CNCM 
1-1590. Les promoteurs et terminateurs sont respectivement repr6sent6s par des drapeaux et des 6pingles-S-che- 
veux. Laflfcche verticale indique la position du site d'insertion du transposon Jn916. Les fteches horizontales indi- 
quent la presence de cadres de lectures (ORF) potentiels. Les noms des g6nes correspondants aux ORFs sont 
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indiqu6s en dessous des filches. Les enzymes de restrictions sont representees de maniere abr6g6 (S=Sacl; H= 
H/ndlll; E= EcoRI; B=SamHI). 

Figure 1.B. Representation des inserts chromosomiques de la souche CNCM 1-1590, presents dans les 11 vec- 
s teurs pFS. P1 . P2 et P3 indiquent la position des sondes qui sont utilisees pendant le criblage. 

Figure 1 .C. Representation de Pinsert g6nomique pFS101 comprenant tout I'operon eps du site de restriction Sacl 
a BamHl, qui est clone dans pJIM2279. 

10 Figure 2. Representation de la densite optique a 485nm des fractions de chromatographie par gel-filtration com- 
prenant les sucres produits par la souche Lactococcus iactis MG1363 transform6e par pFS101 ou pJIM2279. Frac- 
tion 9: 2x10 6 Dalton (Da); fractions 11-13: 5x10 5 Da; fractions 14-16: 7.2x10 4 Da; fractions 17-18: 4x10 4 Da; 
fraction 19 et superieures: < 5x10 3 Da. 

15 Description detainee de i'invention 

Dans la suite de la description, le terme "EPS" designe un exopolysaccharide produit par une bacterie lactique qui 
est constitue par I'assemblage de plusieurs sucres differents formant une unite repetitive. 

On designe par les derives acetyl et phosphatyl, le galactose ou le glucose comprenant au moins un radical acetyl 
20 et phosphatyl aux positions C 2 & C 6 sur le cycle du sucre. 

Au sens de la presente invention, on entend par "sequence homologue" toute sequence nucieique ou d'acides ami- 
nes ayant une fonction identique, ne differant des sequences selon llnvention que par la substitution, la deletion ou 
I'addition d'un petit nombre de bases nucieiques ou d'acides amines, par exemple 1 a 500 paires de bases (pb) ou 1 a 
150 acides amines. 

25 Dans ce cadre, on considerera en particulier com me homologues deux sequences d'ADN qui, du fait de la d6g6- 
n6rescence du code g6netique, codent pour un meme polypeptide. De m§me, on considerera comme homologues 
deux proteines fonctionnelles qui sont reconnues par un m§me anticorps, le rapport des valeurs d'intensrte de recon- 
naissance des deux proteines par I'anticorps n'excedant pas 1000, de preference 100, par exemple. 

On considerera aussi comme sequence homologue, celle qui presente plus de 70% d'homologie avec les sequen- 
ce ces selon I'invention, en particulier plus de 80% ou 90%. Dans ce dernier cas, I'homologie est d6termin6e par le rapport 
entre le nombre de bases ou d'acides amines d'une sequence homologue qui sont identiques a cedes d'une sequence 
selon llnvention, et le nombre total de bases ou d'acides amines de ladite sequence selon I'invention. 

Au sens de la presente invention, on entend par "fragment qui s'hybride*' tout fragment capable de s'hybrider aux 
fragments selon I'invention par la methode de Southern-Blot (Sambrook et aL, Molecular Cloning, A Laboratory 
35 Manual, Cold Spring Harbor Laboratory Press, U.S.A., 1989. chapitres 9.31 a 9.58). De preference, rhybridation est 
conduite dans des conditions stringentes de maniere a eviter des hybridations aspecrf iques ou peu stables. 

Enfin, le terme "fragment" ou "fragment d'ADN" doit etre compris comme un ADN double brin d'origine chromoso- 
mique, qui peut etre synth6tise\ reproduit in-vitro par exemple par la methode connue appelee "Polymerase Chain 
Reaction", ou reproduit in-vivo dans une bacterie du type Escherchia coil Lactococcus Iactis, ou Streptococcus 
40 thermophilus par exemple. 

Pour selectionner un fragment d'ADN selon la presente invention, il est possible de constituer une banque de 
grands fragments d'ADN d'une bacterie lactique produisant un EPS dans une bacterie lactique ne produisant pas 
d'EPS, puis de selectionner le ou les cldne(s) produisant un EPS. Pour cela, on digere I 'ADN genomique d'une bacterie 
lactique produisant un EPS par une enzyme de restriction qui est sp6cif ique d'un site de restriction relativement rare 
45 (SamHI, Sail Pst\) ou par une digestion partielle avec SauZA, par exemple. On clone le produit de digestion dans un 
plasmide d'expression ou d'integration qui accept e de grands fragments (plasmide pSA3 deer it a r exemple II), on intro- 
duit les plasmides recombinants dans la m£me espece de bacterie lactique ne produisant pas d'EPS, on seiectionne 
au moins un clone transforme produisant un EPS, puis on identif ie. on isole et on sequence classiquement le fragment 
d'ADN responsable de la production d'EPS. 
50 Vu que les fragments d'ADN selon la presente invention sont susceptibles d'etre de grande taille, du fait qu'ils peu- 
vent contenir un groupe de genes impliques dans la biosynthese d'EPS, on peut pref6rer introduire les plasmides 
recombinants dans la meme souche de bacterie lactique dont provienne les fragments, a la difference pres que cette 
souche a perdu la capacite de produire des EPS suite a un traitement mutag6nique (traitement U.V., chimique ou par 
transposon). 

55 Une alternative a la methode decrite ci-dessus peut aussi consister a constituer une banque plasmidique de frag- 
ments d'ADN d'une souche de bacterie lactique produisant un EPS, a transformer la meme souche de bacterie lactique 
par les plasmides incapables de s'y repliquer, a selectionner les transformants ayant int6gr6 un plasmide dans leur 
genome par recombinaison homologue (selection par une resistance a un antibiotique, par exemple), a selectionner les 
transformants ne produisant plus d'EPS, puis a isoler et sequencer les fragments d'ADN chromosomique des transfer- 
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mants seiectionn6s qui sorrt adjacents au plasmide int6gr6. Pour cela, on peut dig6rer le chromosome des transfor- 
mants, le tiguer, puis effectuer une PCR-inverse a I'aide de sondes sp6crfiques du plasmide irrtegre ou introduire le 
produtt de ligation dans une souche dans laquelle le plasmide recircularis6 est capable de se rgpliquer, par exemple. 
Une autre alternative a la method e de selection d6crite ci-dessus peut aussi consister a transformer des bact6ries 

5 lactiques produisant un EPS par un plasmide comprenant un transposon, a soumettre les bact&ies a des conditions 
dans lesquelles le transposon s'exdse du vecteur et s'integre au hasard dans le genome, a seMectionner les clones de 
bact6ries ayant perdu la capacity de produire des EPS, a isoler les fragments d'ADN genomiques desdits clones dans 
lesquels un transposon s'est int6gr6. Cette methode est d6crite plus en detail dans r exemple I pr6sente ci-apres. 
II faut remarquer que les methodes de selection deaites brievemerrt ci-dessus peuvent 6tre appliquees a toutes 

10 les bacteries lactiques connues. notamment aux bacteries lactiques mesophiles comme par exemple Streptococcus 
cremoris, Streptococcus (act is, Lactobacillus casei subsp. casei et Lactobacillus sake, et les bacteries lactiques ther- 
mophiles comme par exemple Streptococcus thermophilus, Lactobacillus delbruecki subsp. bulgaricus et Lactobacillus 
helveticus. A cet effet, I'homme du metier dispose de techniques de transformation pour chaque espece de bacterie 
lactique, et en particulier pour Lactobacillus delbruecki subsp. bulgaricus (Sasaki Y. et a/., FEMS Microbiology 

is Reviews, 12, Fourth Symposium on Lactic Acid Bacteria, Noodwijkerhout, The Netherlands, Sept 1993). 

De plus, les methodes de selection decrites ci-dessus permettent le plus souvent d'isoler seulement une partie 
d'un gene ou d'un groupe de genes impliqu6s dans la biosynthese d'un EPS. Neanmoins, I'homme du metier peut faci- 
lement identifier la partie restante du gene ou du groupe de genes en seiectionnant dans une banque chromosomique, 
a I'aide de sondes nucl eiques basees sur un fragment isoie, un ou plusieurs clones renfermant la partie restante, par 

20 exemple (voir I'exemple 1. 6) 

On a pu ainsi caracteriser une sequence d'ADN de 15,2 kb de la souche Streptococcus thermophilus d6pos6e le 
7 juin 1995, aupres de la Collection National e de Culture de Microorganisme (C.N. CM.), Institut Pasteur, 28 rue du Dr 
Roux, 75724 Paris cedex 15, France, ou elle a re y u le num6rode d6pfit CNCM 1-1 590. Par ailleurs, cette souche Gram- 
positif presente au microscope un aspect de coques non f lag el lees formant des chatnettes. Cette souche ne fait pas de 

25 spores et elle est anaeorobe facultative. 

Cette sequence de 15,2kb comprend des genes codant pour des enzymes nouvelles impliquees dans la biosyn- 
these d un EPS ayant la structure r6p6tee 

..>3)-p-D-Galp(l-->3)-p-D-Glcp(l->3)-|J-D-Gai/7NAc(l--> 



P -D-Gal/? 

35 



Les nucleotides 648 a 15250 de cette sequence de 15,2kb sont representees dans la sequence SEQ ID NO:1 don- 
nee dans la liste de sequence ci-apres. 13 genes complets sont delimites dans la sequence nucieique SEQ ID NO:1 

40 par les nucleotides 352-1803, 1807-2535, 2547-3239, 3249-3995, 4051-4731. 4898-5854, 6425-7540, 7736-8212, 
8221-9192. 9285-10364, 10392-11339, 11302-12222. et 12233-13651. 

On a pu montrer que tout ou partie de la sequence SEQ ID NO:1 kb permet, suite a une transformation, de restau- 
rer une biosynthese d'EPS dans une cellules hdte, comme une bacterie lactique mesophile ou thermophile qui initiate* 
ment n'en produisait pas, notamment dans un Streptococcus ou un Lactococcus. A titre d' exemple, la sequence d'ADN 

45 selon [Invention peut ainsi §tre utilisee pour restaurer la production d'EPS dans un mutant de la souche S. 
thermophilus CNCM 1-1590 n'en produisant plus (mutant naturel ou issu d'une mutagenese). 

Pour restaurer la biosynthese d'un EPS, on peut integrer tout ou partie de la sequence SEQ ID NO:1 comprenant 
au moins un des genes pr6cites dans une cellule hdte au moyen du procede d6crit dans EP564966, ledit proc6d6 etant 
incorpore par reference dans I'enseignement de la presente invention. En resume, ce proc6de permet de pouvoir (1) 

so transformer la cellule hftte avec un plasmide donneur qui ne s'y replique pas, (edit plasmide comprenant ledit fragment 
integre fonctionnellement (le cadre de lecture est conserve) dans une partie d'un op6ron issu de la cellule hOte; (2) 
identifier les transformants comprenant int6gr6 la totality du plasmide; (3) seiectionner des transformants comprenant 
uniquement integre dans le chromosome le fragment selon (Invention, les autres sequences du plasmide s'etant excise 
du chromosome; (4) et cultiver les transformants seiectionnes dans des conditions appropriees pour la production d'un 

55 EPS. 

On peut noter que ce procede permet de ne pas utiliser des sequences promoteur et deactivation traductionnelle 
fonctionnels. De plus, les conditions de culture appropriees pour la production d'EPS sont a la portee de I'homme du 
metier, qui peut utiliser des milieux de culture standards, et choisir le pH, la temperature et I'agitation du milieu optimum 
selon la souche utilisee. 
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On peut aussi choisir de doner tout ou partie de ta sequence SEQ ID NO:1 comprenant au moins un des genes 
precites dans un plasmide d'expression autoreplicatif en aval de sequences promoteur et d'activation traductionnelle 
fonctionnels, et le cas 6ch6ant en amont d'un terminateur, puis de transformer une cellule h6te par le plasmide recom- 
binant. 

Par ailleurs, on peut observer que I'EPS produit par une cellule h6te transform6e par la sequence SEQ ID NO:1, 
par exemple un Lactococcus lactis ne produisant pas inrtialement un EPS, peut §tre different de i'EPS qui devrait etre 
normalement synth6tis6 par les enzymes recombinantes, en I'occurence PEPS produit par la souche CNCM 1-1590. 
L'utilisation de tout ou partie de la sequence de 15.2 kb peut done permettre la creation de variants de I'EPS d6crit ci- 
dessus. 

De m§me, on a pu montrer que tout ou partie de la sequence SEQ ID NO:1 peut aussi permettre, suite £ une trans- 
formation, de modifier la structure r6p6tee d'un EPS produit initialement par une cellule h6te, par exemple par une bac- 
terie lactique mesophile ou thermophile, notamment un Streptococcus ou un Lactococcus. 

Ces observations ouvrent ainsi la possibility de rSaliser une methode originale de production d'un nouvel EPS, 
dans laquelle (1) on clone dans un vecteur un fragment d'ADN codant partiellement ou totalement pour au moins une 
enzyme impliquee dans ta biosynthese d'un EPS; (2) on transforme des bacteries lactiques par le vecteur recombinant; 
(3) on sSlectionne le cas 6ch6ant une bact6rie lactique produisant un nouvel EPS; (4) puis on cuftive la bacterie lactique 
transformSe dans des conditions appropriees pour la production d'un nouvel EPS. De preference le vecteur code pour 
les proteines selon I'invention. De plus la bacterie lactique peut produire un autre EPS que celui synthetise par les pro- 
teines codees par I edit vecteur. 

En particulier, on clone dans un vecteur dlntegration un fragment d'ADN codant partiellement pour au moins une 
enzyme impliquee dans la biosynthese d'un premier EPS, on introduit le vecteur recombinant dans des bacteries lacti- 
ques m6sophiles ou thermophiles, pouvant le cas 6ch6ant produire un deuxieme EPS par Pintermediaire d'un ou plu- 
sieurs genes chromosomiques ou plasmidiques, on isole les bacteries ayant integr6s dans leur chromosome le vecteur 
dlntegration, puis on s6lectionne celles qui produisent un nouvel EPS a cause de I'inactivation d'un ou plusieurs genes 
impliqu6s dans la biosynthese du deuxieme EPS. De preference, le premier et le deuxieme EPS sont identiques, et on 
choisit un fragment d'ADN codant partiellement (au moins 15 paires de bases) pour au moins une enzyme impliqu6e 
dans I'adjonction d'un sucre sur la chaine laterale de I'unite repetitive ou dans la modification d'un sucre comme une 
sulpho-, phosphoryl- ou acetyl -transferase, par exemple. 

De mSme, on peut doner dans un vecteur d'expression r6plicatif un fragment d'ADN codant totalement pour au 
moins une enzyme impliquee dans la biosynthese d'un premier EPS, on peut introduire le vecteur recombinant dans 
des bad6ries lactiques mesophiles ou thermophiles, pouvant le cas echeant produire un deuxieme EPS par I'interme- 
diaire d'un ou plusieurs genes chromosomiques ou plasmidiques, on peut isoler les bad6ries renfermant le vedeur 
replicatif, puis on peut seiedionner celles qui produisent un nouvel EPS a cause de I'expression d'un ou plusieurs 
genes impliqu6s dans la biosynthese du premier EPS. De preference, on choisit des fragments d'ADN codant pour des 
enzymes impliquees dans la modification d'un sucre comme une sulpho-, phosphoryl- ou acetyl-transferase par exem- 
ple, ou dans I'adjondion a I'unite repetitive d'un sucre comme une glucosyl-ou une galadosyl-transferase, par exemple. 

De preference, on utilise totalement ou partiellement au moins un des genes portes par la sequence SEQ ID NO:1. 
On peut aussi utiliser au moins un gene plasmidique de bad6ries ladiques m6sophiles impliqu6 dans la biosynthese 
d'un EPS (gene que Ton peut sequencer a part' r de plasmides connus). 

Enfin, le vedeur recombinant peut etre tout fragment d'ADN, simple ou double brin, lineaire ou circulaire, d'expres- 
sion ou d'integration, et comprenant un une sequence d'ADN selon I'invention notamment tout ou partie de la sequence 
SEQ ID NO:1 . Dans le cas ou le proc6d6 d6crit dans EP564966 n'est pas utilise, il faut veiller a ce que le vedeur puisse 
exprimer I'ADN selon I'invention par des sequences nucieiques adaptees (promoteur; site d'attachement du ribosome; 
codon pr6fer6), et le cas 6ch6ant a ce qui! comprenne une ou plusieurs origines de replication de diverses bad6ries, 
notamment ^Escherichia coli et/ou d'un Streptococcus, par exemple. 

L'inverrtion concerne aussi les nouvelles enzymes codees par les genes de la sequence SEQ ID NO:1 , notamment 
les sequence qui leur sont homologues On peut ainsi envisager de les utiliser pour modifier ou synth6tiser in-vitro un 
oligosaccharide ou un polysaccharide comme un EPS. par exemple. Pour cela. il est preferable de purifier au moins 
une de ces enzymes, en surexprimant classiquement leur gene dans une bad6rie et en les isolant dassiquement. par 
precipitation et/ou chromatographic du milieu de culture, par exemple. 

Un autre objet de la pr6sente invention concerne une bad6rie ladique comprenant, int6gr6 dans son chromosome 
ou par le moyen d'un plasmide r6plicable, une sequence d'ADN selon I'invention. De preference, la sequence com- 
prend au moins un des genes de la sequence SEQ ID NO:1. 

L'inverrtion concerne aussi toute utilisation de fragments de la sequence SEQ ID NO:1 ou de fragments du brin 
compiementaire de cette sequence, d'au moins 15 paires de bases, comme amorce pour faire une PCR ou comme 
sonde pour deteder in-vitro ou inadiver in-vivo des genes de bad6ries ladiques impliques dans la biosynthese d'un 
EPS. Cette limite inf6rieure est arbitrairement fix6e du fait que les petits fragments s'hybridant sp6cifiquement ont 
generalement une longeur de 15-25 pb. 

La pr6sente invention est d6crite plus en detail ci-apres a Paide du complement de description qui va suivre, qui se 
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r6fere k des exemples d'obtention de fragments d'ADN, de plasmides recombinants et de bacteries transformers selon 
I'invention. Ces exemples sont precedes d'une description des milieux de culture. II va de soi. toutefois, que ces exem- 
ples sont donnes k titre d'illustration de I'objet de I'invention dont ils ne constituent en aucune maniere une limitation. 
La manipulation de I'ADN, le clonage et la transformation de cellules bacteriennes sont, en I'absence de precisions con- 
s traires, effectues selon les protocoles decrits dans I'ouvrage de Sambrook et al. cite plus haul Les pourcentages sont 
donnes en poids, sauf indication contraire. 

Milieux: (rajouter 1 ,5% de Bacto-agar pour un milieu solkJe) 

w - M1 7 (Difco.USA): tryptone 0,5%, soytone 0,5%, viande hydrolysee 0,5%, extrait de levure 0,25%, acide ascorbique 
0.05%. sulphate de magnesium 0,025%, disodium-beta-glycerophosphate 1,9% et de I'eau. 
LM17: milieu M17 comprenant 1%de lactose. 
GM 1 7: milieu M 1 7 comprenant 1 % de glucose. 

- MSK: lait 6crem6 (poudre reconstitute k 10%) comprenant 0,1% d'extrait de levure. 

is - MAM: lait ecreme (poudre reconstitute k 10%) comprenant 10% d'un melange tfrides amines (495 mg/1 Ala, 343 
mg/l Arg, 682 mg/l Asp, 59 mg/l Cys, 1229 mg/l Glu, 759 mg/l Gly, 153 mg/l His, 215 mg/l Iso, 470 mg/l Leu, 565 
mg/l Lys. 122 mg/l Met, 255 mg/l Phe, 436 mg/l Pro, 68 mg/l Ser, 170 mg/l Thr, 61 mg/l Try, 304 mg/l Val ajuste k 
PH5). 

- HJL: tryptone 3%, extrait de boeuf 0,2%, extrait de levure 1%, lactose 1% et KH 2 P0 4 pH 6,5 0,5%. 

20 - Rouge de Ruthenium: extrait de levure 0.5%, lait en poudre ecremt 10%, sucrose 1%, agar 1,5% et 0,08g/l de 
rouge de ruthenium (voir FR2632968). 

Exemple I: clonage d'un fragment d'ADN de la souc he S. thermophilus Sfi6 

25 1.1. Selection d'une souche S. thermophilus oroductrice d'EPS: on cultive les souches de bacteries lactiques de la 
collection Nestle dans un milieu liquide HJL et on en etale des dilutions sur un milieu solide Rouge de Ruthenium. Les 
souches productrices d'EPS demeurent de couleur blanche car les EPS empechent le colorant de teinter leur paroi cel- 
lulaire. Par contre, les souches non-productrices se colorent en rouge du fait de I'aff inite du colorant pour le peptidogly- 
cane de leur paroi ceilulaire. 

30 On a ainsi selectionne parmi les bacteries lactiques productrices d'EPS la souche S. thermophilus Sfi6, qui a recu 
le numero de depfit CNCM 1-1590 et que Ton designera dans la suite des exemples par I'expression "souche Sfi6". 

I.2 .Structure reo&eede I'EPS: la structure de I'EPS produit par la souche Sfi6 a 6t6 publiee par Doco et al. (Car- 
bohyd.Res., 138, 313-321, 1995). Cet EPSpresente la composition Glc:Gal:GalNac=1:2:1, et I'unite tetrasaccharidique 
repetee: 

35 

->3>P-D-Galp( i ~>3)-p-D-Glcp( I-->3)-p-D-Gai/?NAc(l »> 

6 
I 

40 1 

p -D-Gal/? 



45 1.3. Mutapenese par le transposon Tn916: on rend la souche Sfi6 rtsistante & la streptomycin e en la cultivant par 
des transferts repetes dans un milieu HJL supplements par des teneurs croissantes de 20 k 2000jig/ml de streptomy- 
cine, puis en selectionnant les souches devenues naturellement resistantes. 

On conjugue la souche Sfi6 resistarrte & fa streptomycine et la souche Enterococcus faecalis JH2-2 qui possede 
un plasmide pAM180 portant le transposon Tn975 [Tn916 est connu pour porter un gene de resistance k la tetracy- 

so dine; Gawron et a/., Nature, 300, 281 -283, 1982). Pour cela, on melange k 1 ml d'une culture d'une nurt dans un milieu 
M17 k 37°C de la souche E. faecalis JH2-2, 10ml d'une culture d'une nuit dans un milieu HJL k 42°C de la souche Sf i6, 
on centrifuge les cellules et on les resuspend dans des tubes comprenant IOOjjiI de milieu HJL, on depose la suspen- 
sion sur un milieu solide LM17 que Ton incube k 37°C pendant 20h, on recupere les cellules par grattage et on les 
resuspend dans des tubes de 10 ml de milieu liquide HJL, on incube les tubes k 42 C C pendant 4h en les agitant de 

55 temps en temps, puis on 6tale des dilutions des cultures sur un milieu LM1 7 solide supplemente de 2,5p.g/ml de tetra- 
cycline et 2000ng/ml de streptomycine. 

En realisant 20 conjugaisons en parralleles (mutations independantes). on a pu ainsi selectionner 2x1 0 4 transcon- 
jugants resistants k la tetracycline et k la streptomycine. 

I A Selection de mutants de la s ouche Sfi6 ne produisant olus d'EPS fohenotvpe EPSf 01: on transfert les transcon- 
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jugants r6sistants sur le milieu solide Rouge de Ruthenium supplements par 2,5ng/ml de tetracycline el 2000fig/ml de 
streptomycine. Environ 1 0% des transconjugarrts torment des colonies rouges EPS(-). On seiectionne ensuite environ 
800 colonies rouges que Ton cultive une nurt dans des plaques de microtitration comprenant 200fil de milieu HJL sup- 
plements de 2,5ng/ml de tetracycline. On cultive ensuite 1 0OuJ de la culture HJL dans 1 ml d'un lait MSK. Environ, 25% 

5 des colonies rouges testees presentent un phenotype EPS(-) stable dans le lait (le lait n'est pas epais et f ilant, et I'ana- 
lyse du surnageantde culture ne rev&le pas d'EPS). Les autres colonies rouges presentent un phenotype EPS(+) ou 
retrouvent le phenotype EPS(+) apres plusieurs sous-cultures dans le lait. 

En conclusion, les mutants stables EPS(-) ont perdu leur capacity a produire des EPS a cause de (Integration du 
transposon Tn916 dans un gene chromosomique implique dans la biosynthese des EPS. En effet, les mutants stables 

10 EPS(-) peuvent retrouver un phenotype EPS(+) lorsqu'on les cultive dans un milieu de croissance depourvu de tetra- 
cycline (excision et perte du transposon). 

1 .5 Caracterisation de mutants stables EPS(-) : on analyse environ 100 mutants stables par Southern-blot d'une 
preparation d'ADN chromosomique des mutants, diger^e par H/ndlll, el hybridation du filtre de Southern-blot avec le 
gene tetM radioactif (code une resistance a la tetracycline) provenant du plasmide plC182 (Hill et a/., Applied and Env. 

is Micro., 54, 1230-1236, 1988). Environ 85% des mutants analyses presentent une bande majoritaire identique corre- 
pondant a un locus appelle "locusA". On peut remarquer pour certains des autres mutants deux autres bandes majori- 
taires (locus B et C) correspondant a des locus connus impliques dans la biosynthese de la paroi cellulaire (publication 
en preparation). 

1.6 Caracterisation du locus A : les regions chromosomiques proches du transposon Tr\916 integre peuvent etre 
20 isoiees par une PCR-inverse. Pour cela, on dig6re classiquement 1p,g d'une preparation d'ADN chromosomique d'un 

mutant choisi arbitrairement (mutant n°1) par H/ndlll pendant 4h, on extrait I'ADN au phenol/chloroforme, on le dilue 
dans 720f.il d'eau, on chauffe I'ADN dilu6 a 56°C pendant 5 min, on refroidit I'ADN sur de la glace, on lui ajoute 80fxl 
d'un tampon de ligation 10 fois concentre et 5 unites d'une T4-ligase (Boehringer-Manheim), on I'incube a 12°C pen- 
dant 16 h, on le chauffe a 70°C pendant 15 min pour inactiver la ligase, puis on le concentre dans un volume de 100jil 

25 par plusieurs extractions successives dans du butanol. On ajoute ators dans un dispositif de PCR 1 du melange de 
ligation, 100pmol d'amorces. 15mM dedNTPs, lOuil de tampon et0,2 unite de Super-Taq polymerase (Stehlin GmBH). 
Les amorces nucieiques (ou primers) sont choisies a partir de la sequence connue du transposon Tn976\ 

En utilisant les amorces ayant la sequence SEQ ID NO:15 et SEQ ID NO: 16 on a pu isoler par PCR un fragment 
de 1kb. De plus, en utilisant les amorces SEQ ID NO:17 et SEQ ID NO:18 on a pu isoler un fragment de 4kb (voir la 

30 liste de sequences ci-apres). 

Un troisieme fragment de 0.8Kb peut £tre aussi isoie du mutant n°1 , en realisant une second e PCR-inverse a partir 
de son ADN chromosomique dig6r6 par Rsal et a I'aide des amorces ayant la sequence SEQ ID NO:18 et SEQ (D 
NO: 19 (voir la liste de sequence ci-apres). 

Les fragments de 1Kb et de 0.8Kb ont ete clones dans le plasmide linearise pGEMT (Promega, USA). Le sequen- 

35 cage de ces fragments par la m6thode des dideoxynucieotides (Kit f-mol® DNA Sequencing System, Promega) montre 
deux sequences qui, en se recoupant, couvrent trois cadres de lectures ouvertes (ORFs) correpondants aux nucleoti- 
des 9933 a 1 1643 de la sequence SEQ ID NO:1 . 

Les fragments de 1 Kb et 4Kb ont egalement ete utilises pour cribler une banque X-ZAP Express (Stratagene, USA) 
renfermant des fragments d'ADN de la souche Sfi6. Pour cela, selon les recommandations du fournisseur on digere 

40 partiellement une preparation d'ADN dudit mutant par Sau3A, on s6pare les fragments par une eiectrophorese sur gel 
dagarose, on coupe du gel les bandes correspondantes a des fragments de 5 a 12Kb t on eiue t'ADN, puis on le ligue 
au vecteur X-ZAP Express prealablementdig6repar BamHI. On encapside in-vitro le produit de ligation a I'aide du sys- 
teme Gigagoldlll (Stratagene), on melange ensuite les phages avec des Escherichia coli XLIBlue (Stratagene) selon 
les recommandations du fournisseur, puis on etale le melange sur boTte de Petri. On analyse ensuite tes plaques 

45 recombinantes par hybridation de leur ADN transfer sur une membrane Hybond-N (Amersham Life Sciences, UK) 
avec les fragments de 1to et 4Kb prealablement rendus radioactifs (Kit Random Primed DNA Labeling, Boehringer- 
Manheim). 

Parmi 3000 plaques recombinantes, on a pu seMectionner par hybridation environ 20 plaques positives, desquelles 
on a ensuite isoie les vecteurs X-ZAP Express, puis excise les vecteurs pCMV renfermant un insert chromosomique 
so (voir les recommandations du fournisseur Stratagene). Ces vecteurs recombinants sont appeies dans la suite des 
exemples "pFS". 

On a ensuite sequence les inserts chromosomiques de 1 1 vecteurs pFS (Kit f-mol® DNA Sequencing System), a 
savoir les vecteurs pFSU, pFSiS, pFS26, pFS30, pFS33, pFS49. pFS50, pFS65, pFS73, pFS80 et pFS86 (voir figure 
1.B) qui comprennent respectivement des fragments correspondant aux nucleotides de la sequence SEQ ID NO:1, 
55 9314-14602, 1-3159. 7988-11253, 1702-7991. 1361-7229, 4400-8477, 648-7676. 5997-11253. 8474-13489. 3550- 
7229, et 648-1702. 

En recoupant les sequences nucieiques des differents inserts chromosomiques, on a pu ainsi caracteriser une 
sequence de 1 5,2Kb correspondant au locus A de la souche Sf i6 (voir figure V A). Les nucleotides 648 a 1 5250 de cette 
sequence de 15,2Kb sont represents dans la sequence SEQ ID NO:1 . 
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17. Analyse la sfcwnge SEQ id NQ;1: 

La sequence SEQ ID NO:1 comprend la totalite de I'operon eps de la souche Sfi6. Cette sequence comprend 13 
ORFs complets, dans la meme orientation, que Ton appelle eps A, B, C, D, E, F, G, H, I, J t K, L, M (voir figure 1 .A). Cette 
sequence comprend en outre 1 ORF complet a I'extremite 3' de la sequence, qui est code par le brin complementaire. 
Cet ORF, appelle orfZ, marque probablement la fin de I'operon du fait de son orientation inverse par rapport aux autres 
ORFs. 

La comparaison des sequences en acides amines cod6es par les 1 3 premiers ORFs avec celles de prolines pr6- 
sentes dans ta banque de donnee Swiss-Prot. a I'aide des logiciets FASTA, PEPPLOT et PILEUP de GCG-softwear. 
Wisconsin, USA, permet de d6duire la fonction des 1 3 proteines codees par I'operon eps. Les resultats sont presentes 
ci-apr6s. 

L'ORF epsA (nucleotides 352-1803) code pour une proteine EpsA (SEQ ID NO:2) ayant 26,4% did entite avec la 
proteine LytR de Bacillus subtilis qui est impliquee dans ia regulation de I'autolysine /V-acetylmuramoyl-L-alanine 
(Lazaveric et a/.. J. Gen. Microbiol., 13& 1949-1961. 1992). EpsA est done probablement une proteine de regulation 
de I'operon eps. Par ailleurs, puisqu'un ORF de regulation d'un operon est generalement trouve en amont des autres 
ORFs, le gene epsA est probablement le premier gene de I'operon eps. Ceci est confirme par le fait qu'un terminateur 
est trouve aux nucleotides 230-252, un promoteur aux nucleotides 274-302. et un site d'attachement des ribosomes 
aux nucleotides 340-345 de la sequence SEQ ID NO:1. 

Le gene epsB (nucleotides 1807-2535) code pour une proteine Eps B (SEQ ID NO:3) ayant 67,5% d'identite avec 
la proteine CpsA de Streptococcus agalactiae et 30% d'identite avec la proteine CapC de Staphylococcus aureus 
(Rubens etal., Mol. Microbiol.. 8, 843-885, 1993; Lin etal.,1 Bacterid., 176, 7005-7016, 1994). La fonction precise de 
ces genes est encore inconnue, en dehors du fait qu'ils sont essentiels pour la synthase de la capsule qui est constituee 
de polysaccharides accroches aux phospholipides de la membrane externe des bacteries. 

Le gene epsC (nucleotides 2547-3239) code pour une proteine EpsC (SEQ ID NO:4) ayant 52% d'identite avec la 
proteine CpsB de Streptococcus agalactiae qui est impliquee dans la synthase de la capsule (Rubens et a/.). EpsC a 
aussi 23% d'identite, 49% de similarity, et un prof i I d'hydrophobicite comparable a celui des proteines OLD de Salmo- 
nella typhimurium. Salmonella enterica et Escherichia coli (Batchelor et a/., J. Bacterid. , 174, 5228-5236, 1 992; Bastin 
et a/., Mol. Microbiol., 7, 725-734, 1993). II faut remarquer que les proteines CLD sont impliquees dans le contrdle de 
la longeur des chaTnes de polysaccharides tors de leur biosynthe&e. 

Le gene epsD (nucleotides 3249-3995) code pour une proteine EpsD (SEQ ID NO:5) ayant 60,5% d'identite avec 
la proteine CpsC de Streptococcus agalactiae, ayant 34,5% d'identite avec la proteine CapA de Staphylococcus 
aureus, et ayant 33% d'identite avec la proteine ExoP de Rhizobium meliloti (Rubens et air, Lin et a/.; Becker et a/.. 
Mol. Gen. Genet.. 241. 367-379, 1993). La proteine ExoP est une proteine de membrane qui est impliqu6e dans la 
translocation d'EPS et/ou de precurseurs d'EPS. 

Le gene epsE (nucleotides 4051-4731) code pour une proteine EpsE (SEQ ID NO:6) pr6sentant des homologies 
signif icatives avec de nombreuses proteines ayant une activity galactosyl-transferase (Rubens et a/.). Ce g6ne code 
done probablement pour une galactosyl-transferase. 

On peut remarquer que les genes epsB, C, D, E de S. thermophiius Sfi6 sont similaires a ceux de I'operon de S. 
agalactiae comprenant les genes epsA, B, C, D (Rubens era/.). De plus, ils sont organises de la meme fagon. Bien que 
les polysaccharides de capsule et I'EPS des deux souches soient tres differents, ceci indique qu'une region chromoso- 
mique a ete probablement tranferee entre ces deux especes. 

Le gene epsF (nucleotides 4898-5854) code pour une proteine EpsF (SEQ ID NO:7) ayant respectivement 24,5% 
et 23% d'identite avec les proteines CapH et CapM de S. mutans qui sont impliquees probablement en tant que glyco- 
syl-transf6rases dans la biosynthese de la capsule (Lin et a/.). 

Le gene epsG (nucleotides 6425-7540) code pour une proteine EpsG (SEQ ID NO:8) ayant 20,5% d'identite et 
50% de similarite avec Ea N-acetylglucoseamine-transferase de Salmonella tryphimurium LT2 qui est impliquee dans la 
biosynthese du polysaccharide LPS de la membrane externe (Mac Lachlan et al., J. Bacterid., 1Z2, 7151-7163, 1991). 
Du fait qu'une /V-ac6tylglucosamine n'est pas impliquee dans la biosynthese de I'EPS de la souche Sfi6 (il n'y a pas de 
glucose acetyie), le gene epsG code probablement pour une glucosyl-transferase, une A/-acetylgalactosyl-transf6rase, 
ou une A/-acetylglucosyl-transf6rase ayant une activite A/-ac6tylglucosamine-epimerase. 

Le gene epsH (nucleotides 7736-8212) code pour une proteine EpsH (SEQ ID NO:9) ayant de fortes homologies 
avec des acetyl-transferases NodL-LacA-CysE (Downie et a/., Mol. Microbiol, a, 1649-1651, 1989). De ce fait la pro- 
teine EpsH pourrait etre une ac6tyl-transf6rase impliqu6e dans la biosynthese de la N-ac6tylgalactoseamine de I'EPS. 

Le gene epsl (nucleotides 8221-9192) code pour une proteine Epsl (SEQ ID NO:10) ayant 24% d'identite avec une 
proteine, codee par un I'ORF RfbV du cluster rib de Salmonella typhimurium, qui est probablement une glycosyl-trans- 
f6rase (Jiang etal.; Liu etal., J. Bacterid., 177, 4084-4088, 1995). 

Le gene epsJ (nucleotides 9285-10364) code pour une proteine EpsJ (SEQ ID NO:1 1) ayant 20% d'identite et un 
profil d'hydrophobicite comparable a celui d'une proteine d'un ORF du cluster rib de Salmonella enterica qui est lui- 
meme similaire a une polymerase de I'antigene O des salmonelles du groupe B et C2 (Lee et a/., J. Gen, Microbiol., 
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12fi. 1843-1855. 1992; Morona etal. t J. Bacteriol. 17g, 733-747, 1994). Le gene epsJ pourrait done coder une EPS- 
polymerase qui polymer iserail I'unite tetrasaccharide de PEPS. 

Le gene epsK (nucleotides 10392-1 1339) code pour une proline EpsK (SEQ ID NO:12) ayant 18% d'identite et 
42% de similarity avec la proteme, codee par le gene lipB de Neisseria meningitidis, qui est impliquee dans la biosyn- 
these de la capsule en accrochant des polysaccharides aux phospholipides de la membrane externe (Frosch et a/., 
Mol. Microbiol., & 483-493, 1993). Sachant que les S. thermophilus n'ont pas de membrane externe (Gram-positif), le 
gene epsK pounrait done coder une enzyme impliquee dans I'accrochage des EPS aux phospholipides de la membrane 
cellulaire, qui de concert avec un transporter d'EPS (probablement EpsC et EpsD) et une enzyme qui detache les 
EPS. participerait au transport de I'EPS a travers la membrane (modele en accord avec celui presents par Frosch et 
ai). 

Par ailleurs, on peut remarquer que le transposon lr\916 est int6gre dans le gene epsK du mutant n°1 utilise pour 
identifier l'op6ron eps (voir le point I.6 ci-dessus), entre les nucleotides 10540-10541 de la sequence SEQ ID NO:1 . 

Le gene epsL (nucleotides 11302-12222) code pour une proteine EpsL (SEQ ID NO:14) qui ne presente aucune 
homologie avec des prot6ines connues. Les 38 premiers nucleotides sont couverts par I'extremit6 3* de epsK, ce qui 
laisse supposer une expression coordonn6e des deux prolines, et une activrte de la proteine EpsL dans le transport 
membranaire de I'EPS. 

Le gene epsM (nucleotides 12233-13651) code pour une proteine EpsM (SEQ ID NO:13) qui ne presente aucune 
homologie avec des proteines connues de la banque de donnSes Swiss-prot. Ce gene est certainement implique dans 
la biosynthese de I'EPS de la souche Sfi6 car il n'y a pas, en amont, un promoteur spectfique pour ce gene. 

Le gene orfZ (13732-14305 sur le brin compI6mentaire) est present en orientation inverse par rapport au reste des 
ORFs de Top6ron eps. De ce fait, il n'est probablement pas implique dans la biosynthese de I'EPS de la souche Sfi6. 
De plus, il ne presente aucune homologie avec des proteines connues de la banque de donnees Swiss-prot. 

En conclusion, les inserts chromosomiques isoles des 1 1 vecteurs pSF (voir le point I.6 ci-dessus) couvrent une 
region chromosomique de la souche S. thermophilus Sfi6 qui est manifestement impliqu6e dans la biosynthese de 
I'EPS. On a pu ainsi identifier 1 3 genes complets qui comprennent en amont un promoteur delimitant le debut de I'ope- 
ron eps. 

Exernple l|; jnactivatiQP flu q$ne ep$J 

On inactive par recombinaison homologue le gene epsJ de I'operon eps pour conf irmer son importance dans la 
biosynthese de I'EPS. 

Pour cela, on isole un fragment Dra\-Sal\ du plasmide pGEMT renfermarrt le fragment de PCR de 0.8 kb (voir 
I'exemple 1.6 ci-dessus), on le ligue dans le plasmide thermosensible pSA3 (Dao et a/., Appl. Environ. Microbiol., 49, 
1 15-1 19, 1985) prealablement digere par EcoRV et Sail on transforme la souche E. cofi XL1-blue par le produit de 
ligation, on sSlectionne des transfbrmants. on isole un plasmide recombinant, puis on transforme par 6lectroporation la 
souche S. thermophilus Sfi6 avec le plasmide recombinant au moyen d'une m6thode adaptee de celle decrite par Slos 
et ai (Appl. Environ. Microbiol., 5Z. 1333-1339, 1991). On resuspend les cellules soumises £ une dScharge de 2,1kV, 
25nF et 400Q dans 1ml de milieu HJLque Ton incube 4h a 37°C (temperature permissive), on Stale les cellules sur un 
milieu solide LM1 7 supplements de 2.5jig/ml d'erythromycine que Ton incube 1 6h a 37°C, puis on selectionne les colo- 
nies transformees qui survivent. On incube ensuite les colonies sSlectionnSes dans 2 ml de milieu HJL supplements 
de 2,5jig/ml d'erythromycin jusqu'a ce que la densite optique a 600nm (DO 600 ) de la culture atteigne 0,2, on soumet la 
culture a 45°C jusqu'^ ce que la D0 60 o atteigne 1 .0 (le plasmide ne se replique plus), puis on 6tale des dilutions de la 
culture sur un milieu LM 17 solide supplements de 2,5jmg/ml d'erythromycine que Ton incube 12h a 45°C. 

Les colonies qui survivent ont integre dans le gene epsJ le plasmide pSA3 recombinant. Ceci peut §tre v6rif i£ par 
Southern-Blot d'une preparation d'ADN chromosomique des colonies survivantesdiger6e par EcoRI (coupe une seule 
fois dans pSA3). et hybridation du filtre de Southern-Blot avec le fragment radioactif precite Dra\-Sal\. Les colonies 
ayant integre le plasmide pSA3 presentent deux bandes sur le filtre de Southern-Blot. De plus, les colonies ayant inte- 
gre dans epsJ le plasmide pSA3 recombinant presentent un phenotype EPS(-) sur un milieu solide Rouge de Ruthe- 
nium, et ont perdu leur caractere filant dans un lait MSK (voir I'exemple 1.4 ci-dessus). 

Exemple III: inactivation d es genes eps A. B. C. D. E. F. G. H. /. K. L M 

On a montre aux exemples I et II que reactivation des genes epsK et eps J, par insertion d'un transposon ou d'un 
plasmide integratif, interrompt la biosynthese d'EPS dans la souche Sf i6. 

De m§me, on peut inactiver par recombinaison homologue les autres genes de i'operon eps de la souche Sf i6, et 
observer ainsi une interruption de la biosynthese d'EPS. Pour cela, on amplifie par PCR un fragment d'un ORF prove- 
nant d'un des 1 1 vecteurs pFS dScrits a I'exemple I.6 ci-dessus. On le clone dans le plasmide pSA3, puis on le trans- 
forme et on I'integre a la souche Sf i6 dans les m§mes conditions que eel les decrites a I'exemple precedent. 
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fagmple IV; restaurgtipn tfe la PTOtiMCtiQn tf EPS 

On coupe par EcoRI pFS30, on s6pare les fragments, on ligue le fragment de 5.5 kb k pFSl 4 pr6alablement digerS 
par EcoRI, on transforme des cellules XL1 -blue par le produit de ligation, on sSlectionne des clones transform 6s prS- 
sentant une bonne orientation des inserts, on isole un plasmide appellS pFS30-14, on ligue un fragment EcoRI central 
de pFS65 k pFS30-14 prSalablement coups par EcoRI, on transforme des cellules XL1-blue par le produit de ligation, 
puis on sSlectionne des clones transformSs prSsentant une bonne orientation des inserts. Le plasmide recombinant 
resultant, appellS pFS30-65-14, comprend les nucleotides 1702 k 14602 de la sequence SEQ ID NO:1. 

On coupe ensuite pFS30-65-14 par Sail et Sma\, on s6pare le fragment de 12.9 kb. on le ligue k pSA3 pr6alable- 
ment coupS par EcoRV et Sail, on transforme des cellules XL1 -blue par le produit de ligation, on sSlectionne des clo- 
nes transformSs, et on isole des plasmides pSA3 recombinants. 

On transforme par Slectroporation la souche S. thermophilus CNCM 1-1292 dSposSe le 29 mars 1993 par les plas- 
mides pSA3 recombinants. Cette souche Gram-positive presents au microscope un aspect de coques non flagellSes 
formant des chaTnettes, elle ne fait pas de spores, elle est anaSorobe facultative, elle ne produit pas d'EPS, et elle pr6- 
sente dans son gSnome 1000 pb correspondant k I'extrSmitS 5* de I'operon eps. Le plasmide pSA3 recombinant peut 
done s'intSgrer dans le gSnome de la souche CNCM I- 1 292. Certains des clones transforms prSsentent un phenotype 
EPS(+) sur un milieu solide Rouge de Ruthenium, et un caractSre f ilant dans un lait MSK. 

Exemole V restauration de la production d'EPS 

On digSre le chromosome de la souche Sfi6 par des enzymes qui ne coupent pas dans la sequence SEQ ID NO:1 
(SamHI, Sai\ t Nru\ t Stu\), on separe le produit de digestion sur un gel d'agarose, on glue les bandes de 15-25 kb, on 
les ligne dans pSA3 prSalablement coupS par une enzyme de restriction appropri6e. on transforme par eiectroporation 
la souche S. thermophilus CNCM 1-1 292, puis on seiectionne des transformants par transferts des colonies sur un f iltre 
suivi d'une hybridation de leur ADN avec ('insert de pFSU rendu pr6alablement radioadif. Certains des clones trans- 
formes pr6sentent un ph6notype EPS(+) sur un milieu solide Rouge de Ruthenium, et un caractSre filant dans un lait 
MSK. 

Exemple VI modification d'un EPS 

On transforme par eiectroporation la souche S. thermophilus CNCM 1-1422, deposSe le 18 mai 1994, par le plas- 
mide pSA3 recombinant de I'exemple V. Cette souche Gram-positive prSsente au microscope un aspect de coques non 
flag elites formant des chaTnettes, elle ne fait pas de spores, elle est anaSorobe facultative, et elle produit un EPS ayant 
la composition Glc:Gal=2:2. 

Exemple VII modification d'un EPS 

On transforme par Slectroporation la souche S. thermophilus CNCM 1-1351, dSposSe le 5 aout 1993, par le plas- 
mide pSA3 recombinant de I'exemple V. Cette souche Gram-positive prSsente au microscope un aspect de coques non 
flag elites formant des chaTnettes, elle ne fait pas de spores, elle est anaSorobe facultative, et elle produit un EPS ayant 
la composition Glc:Gal:Rha=1 :3:2 

Exemple VIII modification d'un EPS 

On isole de I'ADN chromosomique de la souche CNCM 1-1590 par le mSthode de Slos et al. (Appl. Environ. Micro- 
biol., 5L 1333-1339, 1991). On digSre la preparation d'ADN par Sad et BamHI, on sSpare les fragments d'ADN par 
SlectrophorSse sur gel d'agarose 0,7%, on Slue les fragments de 1 2 k 1 6kb, on ligue I'ADN extrait au vecteur pJIM2279 
(obtenu de P. Renault, INRA, Jouy-en-Josas, Paris, France) prSalablement digSrS par Sad et BamH\ puis dSphospho- 
rylS. On transforme la souche Lactococcus lactis MG1363 (J. Bacteriol., 154. 1-9, 1983), cultivSe sur milieu GM17 k 
30°C, par la mSthode de De Vos et al. (Gene. §§, 1 69-1 76. 1 989). On sSlectionne les clones transforms par hybrida- 
tion du DNA gSnomique des clones avec Tune des sondes ayant la sequence SEQ ID NO:15, 16, 17. 18 et 19. Parmi 
400 transformants, 6 clones positifs sont sSlectionnSs, dont 1 comprend un plasmide appelS pFS101 reprSsentS k la 
figure 1.C. 

Pour determiner si le plasmide pFS101 est capable d'induire la production d'EPS recombinant L lactis MG1363 
est retransforme par pFSlOl, et directement 6taie sur le milieu solide rouge de ruthenium. A titre de comparaison, L 
lactis MG1363 est transforms par le plasmide pJIM2279 puis est directement State sur le milieu solide rouge de ruthe- 
nium Les rSsuitats montrent que toutes les colonies comprenant pJIM2279 ont un phSnotype rouge (3000 colonies 
EPS(-)). tandis que plus de 99.5% des colonies comprenant pFSlOl ont un phenotype blanc (800 colonies EPS(+), k 
['exception de 2 colonies). La souche L. lactis MG1363 transforms par pFS101 produit done un EPS recombinant. 



11 



EP0 750 043A1 



On fait produire I'EPS de la souche L iactis MG1363 transforms par pFS101 . en la cultivant dans le milieu MAM, 
k un pH de 5,5, k 30°C sous agitation magn6tique de 60 rotation par minute. On isole I'EPS recombinant en m6lan- 
geant le milieu de culture k 40% d'acide trichloro-ac&ique, en centrrfugeant le melange 20 min k 8000g, en mSlangeant 
un volume 6gal d'ac6tone au pr6cipit6, en incubant le tout k 4°C pendant 12h, en precipitant le melange k 10000g pen- 
dant 1h, en mettant en suspension le pr6ciprt6 dans de I'eau, en ajustant le pH du melange k 7, en le dialysant contre 
de I'eau pendant 24h, en rultracentrifugeant k 100000g pendant 1h ( en rSup^rant le sumageant. puis en lyophilisant 
le sumageant. A titre de comparaison, on cultive la souche L Iactis MG1363 transforms par pJIM2279 dans les 
mfimes conditions et on isole les sucres de la mSme manure. 

On determine la quantit6 de sucres neutres totaux par la mSthode de Dubois et al. (Anal. Chem., 28, 350-356, 
1956). Les rSultats montrent que la souche transforms par pFS101 produit 10mg/l de sucres, exprim6 en glucose 
Equivalent, tandis la souche transforms par pJIM2279 produit des traces de sucre (< 1 mg/l). 

On estime le poids molSlaire de I'EPS recombinant par chromatographic sur une colonne de gel-filtration Supe- 
rose-6 (Pharmacia) qui est connects au systeme FPLC (Pharmacia) prSlablement calibr6 avec du dextran commer- 
cial (Sigma) de 2x1 0 6 k 5x1 0 3 Dalton (Da). Pour cela, on dGpose sur la colonne 0,25 k 1 ml d'un Sharrtillon comprenant 
250ng de sucres neutres, on l'6lue par un flux de 0,5ml/min dans un tampon phophate 50mM pH7,2. Pour comparai- 
son, de la mSme manure on s6pare les sucres produits par la souche transforms par pJIM2279. Les rSultats pre- 
sents k la figure 2 montrent que la souche transforms par pJIM2279 produit une petite quanta de polysaccharides 
h&SrogSes ayant certainement pour origine la paroi cellulaire (2-0,5x10 6 Da; fractions 8-15) et une grande quantity 
d'oligosaccharides de petits poids molSulaires (mono- et di -saccharides; fractions 20-22). Par contre, la souche trans- 
forms par pFS101 prSente manifestement un EPS recombinant de haut poids molSulaire d'environ 2x1 0 6 Da (frac- 
tion 9). 

On determine la composition en sucres de I'EPS recombinant par chromatographie en phase gazeuse par la 
mSthode de Neeser et a!, (Anal. Biochem., 142, 58-67, 1 984). Les rSultats montrent que le milieu de culture de la sou- 
che transforms par pFS101 comprend en molarity un ratio 1 :3 de Glc:Gal. On peut d&ecter des traces de rhamnose 
issues de la paroi cellulaire. Par contre, on ne d Steele pas de GalNac. 

La composition de I'EPS produit par la souche L iactis MG1363 transforms par pFS101 est done d iff 6 rente de 
celle de I'EPS produit par la souche S. thermophilus CNCM 1-1590. On peut raisonnablement estimer que la structure 
de I'EPS recombinant est la m§me que celle de I'EPS de la souche CNCM 1-1590, k la difference prS que le GalNac 
est remplac6 par un galactose. 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 
c (i) DEPOSANT: 

3 (A) NOM: SOCIETE DES PRODUITS NESTLE 

(B) RUE: AVENUE NESTLE 55 

(C) VILLE: VEVEY 

(D) ETAT OU PROVINCE: CANTON DE VAUD 

(E) PAYS: SUISSE 

(F) CODE POSTAL: 1800 

(G) TELEPHONE: (41) 21 924 4760 
10 (H) TELE COP IE: (41) 21 924 2880 

(ii) TITRE DE L* INVENTION: BACTERIES LACTIQUES PRODUISANT DES EPS 
(iii) NOMBRE DE SEQUENCES: 19 
(iv) FORME DECHIFFRABLB ■ PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC -DOS /MS -DOS 

15 (D) LOGICIEL: Patent In Release #1.0, Version #1.30 (OEB) 

(2) INFORMATIONS POUR LA SBQ ID NO: 1: 

(i) CARACTERISTIQUES DB LA SEQUENCE: 

(A) LONGUEUR: 14602 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : double 
20 (D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (g,nomique) 
(ix) CARACTERISTIQUE: 

(A) NOM /CLE : CDS 

(B) EMPLACEMENT : 352 . .1803 

(D) AUTRES INFORMATIONS : /product- "epsA* 
(ix) CARACTERISTIQUE: 

2s (A) NOM /CLE : CDS 

(B) EMPLACEMENT: 1807. .2535 
(D) AUTRES INFORMATIONS : /product* "epsB" 
(ix) CARACTERISTIQUE: 

(A) NOM/ CLE : CDS 

(B) EMPLACEMENT: 254 7. .3239 

(D) AUTRES INFORMATIONS: /product* "epsC" 

(ix) CARACTERISTIQUE : 
30 <A) NOM /CLE : CDS 

(B) EMPLACEMENT: 324 9. .3995 

(D) AUTRES INFORMATIONS : /product = "epsD" 

(ix) CARACTERISTIQUE : 

(A) NOM /CLE : CDS 

(B) EMPLACEMENT: 4051. .4731 

(D) AUTRES INFORMATIONS : /products "epsE" 
35 (ix) CARACTERISTIQUE: 

<A) NOM /CLE : CDS 
(B) EMPLACEMENT : 4898. . 5854 
<D) AUTRES INFORMATIONS : /product- a epsF M 
(ix) CARACTERISTIQUE: 

(A) NOM /CLE: CDS 

(B) EMPLACEMENT : 642 5. . 7540 

(D) AUTRES INFORMATIONS: /product* "epsG" 
40 (ix) CARACTERISTIQUE: 

(A) NOM /CLE : CDS 

(B) EMPLACEMENT: 7736. .8212 

(D) AUTRES INFORMATIONS : /product- "epsH" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 8221. . 9192 

45 (D) AUTRES INFORMATIONS : /product = "epsl" 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 9285. .10364 

(D) AUTRES INFORMATIONS: /product- "epsJ" 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 10392. .11339 

SO (D) AUTRES INFORMATIONS : /product- "epsK" 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: misc feature 

(B) EMPLACEMENT :ll302. .12222 
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(D) AUTRE S INFORMATIONS : /product- "CDS (epsL) recouvrant le 
CDS aux nucleotides 10392-11339" 
(ix) CARACTERISTIQUE: 
(A) NOM/CLE: CDS 
5 (B) EMPLACEMENT: 1223 3. .13651 

(D) AUTRE S INFORMATIONS: /product* "epsM" 
(ix) CARACTERISTIQUE : 

(A) NOM/CLE: miflc feature 

(B) EMPLACEMENT: lT73 2. .14305 

(D) AUTRES INFORMATIONS : /function** "cadre de lecture 
ouverte porte par le brin complementaire" 
/product= "orfz" 
10 (ix) CARACTERISTIQUE: 

(A) NOM/CLE: terminator 

(B) EMPLACEMENT: 230. .252 
(ix) CARACTERISTIQUE: 

(A) NOM/CLE: promoter 

(B) EMPLACEMENT: 2 74. .302 
(ix) CARACTERISTIQUE: 

15 (A) NOM/CLE: RBS 

(B) EMPLACEMENT : 3 4 0 . .345 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

TAGTTTGTAA AAGGACGCCA TTTGGTCGTC CTTTTGTGTT GTAGCTAATA TCTGTTCGAA 60 

20 GTGATAATAA GTTAAAATTT TTCAAACTAC TAGAAAAAAT AAAAATATTT GGAAGAAGAA 120 

GACTTATAAT AAATAGGTAA ATATCTGACA ATTTAAAGTT TAACTACTAA AAATGTAAAA 180 

GATAGTTCAC AATATAATGG AAAATGATAT AAATTAAATG ATTGATATCA TAATGAAAAA 240 

CGTTTTCTTA TTTTTTTGAA AAAAGAATGA CAATTGAAAT GAGGTTGTAT TAATGTTATA 300 

25 ATAATAATAA TAATGGGGAA TACCTAATTT TAATTTTTAG GAGCAATTTA T ATG AGT 357 

Met Ser 
1 

TCG CGT ACG AAT CGT AAG CAA AAG CAT ACG AGT AAT GGA TCG TGG GGG 405 
Ser Arg Thr Asn Arg Lys Gin Lys His Thr Ser Asn Gly Ser Trp Gly 
5 10 15 

ATG GTC AAC GTT GGG TTG ACC ATC CTG TAT GCT ATT TTA GCA TTG GTC 453 
Met Val Asn Val Gly Leu Thr He Leu Tyr Ala He Leu Ala Leu Val 
20 25 30 

TTA TTA TTC ACC ATG TTC AAT TAT AAT TTC CTA TCC ITT AGG TTT TTG 501 
Leu Leu Phe Thr Met Phe Asn Tyr Asn Phe Leu Ser Phe Arg Phe Leu 
35 40 45 50 

AAC ATC ATT ATC ACC ATT GGT TTG TTG GTA GTT CTT GCT ATT AGC ATC 549 
Asn He He He Thr He Gly Leu Leu Val Val Leu Ala He Ser He 
55 60 65 

TTC CTT CAG AAG ACT AAG AAA TTA CCA CTA GTG ACA ACG GTT GTA CTG 597 
Phe Leu Gin Lys Thr Lys Lys Leu Pro Leu Val Thr Thr val Val Leu 
40 70 75 80 

GTT ATC TTC TCG CTA GTT TCT CTG GTT GGT ATT TTT GGT TTT AAA CAA 645 
Val He Phe Ser Leu Val Ser Leu Val Gly He Phe Gly Phe Lys Gin 
85 90 95 

ATG ATT GAC ATC ACT AAC CGT ATG AAT CAG ACA GCA GCA TTT TCT GAA 693 
Ati Met He Asp He Thr Asn Arg Met Asn Gin Thr Ala Ala Phe Ser Glu 

* 100 105 110 

GTA GAA ATG AGC ATC GTG GTT CCT AAG GAA AGT GAC ATC AAA GAT GTG 741 
Val Glu Met Ser He Val Val Pro Lya Glu Ser Asp He Lys Asp Val 
115 120 125 130 

AGC CAG CTT ACT AGC GTA CAG GCA CCT ACT AAG GTT GAT AAG AAC AAT 789 
50 Ser Gin Leu Thr Ser Val Gin Ala Pro Thr Lys Val Asp Lys Asn Asn 

135 140 145 

ATC GAG ATC TTG ATG TCA GCT CTC AAA AAA GAT AAA AAA GTT GAT GTT 837 
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w 



lie Glu He Leu Met Ser Ala Leu Lys Lys Asp Lys Lys Val Asp Val 
150 155 160 

AAA GTT GAT GAT GTT GCC TCA TAT CAA GAA GCT TAT GAT AAT CTC AAG 885 
Lys Val Asp Asp Val Ala Ser Tyr Gin Glu Ala Tyr Asp Asn Leu Lys 
165 170 175 

TCT GGC AAA TCT AAA GCT ATG GTC TTG AGT GGC TCT TAT GCT AGC CTA 933 
Ser Gly Lys Ser Lys Ala Met Val Leu Ser Gly Ser Tyr Ala Ser Leu 
180 185 . 190 

TTA GAG TCT GTC GAT AGT AAT TAT GCT TCA AAT CTA AAA ACA ATT TAT 981 
Leu Glu Ser Val Asp Ser Asn Tyr Ala Ser Asn Leu Lys Thr He Tyr 
195 200 205 210 

ACT TAT AAA ATT AAA AAG AAG AAT AGC AAC TCT GCA AAC CAA GTA GAT 1029 
Thr Tyr Lys He Lys Lys Lys Asn Ser Asn Ser Ala Asn Gin Val Asp 
215 220 225 

15 TCA AGA GTC TTC AAT ATT TAT ATT AGT GGT ATT GAT ACC TAC GOT CCG 1077 

Ser Arg Val Phe Asn He Tyr He Ser Gly He Asp Thr Tyr Gly Pro 
230 235 240 

ATT TCA ACA GTG TCA CGT TCA GAT GTC AAT ATC ATT ATG ACA GTA AAC 1125 
He Ser Thr Val Ser Arg Ser Asp Val Asn He He Met Thr Val Asn 
245 250 255 

20 ATG AAT ACA CAT AAG ATT CTC TTG ACG ACT ACT CCA CGT GAT GCA TAC 1173 

Met Asn Thr His Lys He Leu Leu Thr Thr Thr Pro Arg Asp Ala Tyr 
260 265 270 

GTT AAG ATT CCT GGT GGT GGG GCA GAC CAG TAT GAT AAA TTA ACC CAC 1221 
Val Lys He Pro Gly Gly Gly Ala Asp Gin Tyr Asp Lys Leu Thr His 
275 280 285 290 

GCA GGT ATT TAT GGC GTT GAA ACA TCT GAA CAA ACT CTA GAA GAT CTT 1269 
Ala Gly He Tyr Gly Val Glu Thr Ser Glu Gin Thr Leu Glu Asp Leu 
295 3.00 305 

TAT GGT ATT AAG CTT GAT TAC TAT GCA CGA ATT AAC TTC ACA TCT TTC 1317 
Tyr Gly He Lys Leu Asp Tyr Tyr Ala Arg He Asn Phe Thr Ser Phe 
310 315 320 

CTT AAG TTG ATT GAC CAA CTT GGT GGT GTG ACA GTC CAT AAT GAT CAA 1365 
Leu Lys Leu He Asp Gin Leu Gly Gly Val Thr Val His Asn Asp Gin 
325 330 335 

GCT TTC ACA CAA GAG AAG TTT GAT TTC CCG GTT GGA GAT ATC CAA ATG 1413 
Ala Phe Thr Gin Glu Lys Phe Asp Phe Pro Val Gly Asp He Gin Met 
35 340 345 350 

AAT TCA GAG CAA GCA CTT GGA TTT GTT CGT GAA CGC TAT AAT TTA GAT 1461 
Asn Ser Glu Gin Ala Leu Gly Phe Val Arg Glu Arg Tyr Asn Leu Asp 
355 360 365 370 
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40 



GGC GGA GAT AAT GAC CGT GGT AAA AAC CAG GAG AAA GTT ATT TCT GCG 1509 
Gly Gly Asp Asn Asp Arg Gly Lys Asn Gin Glu Lys Val He Ser Ala 
375 380 385 

ATT TTA AAC AAG TTG GCT TCT CTA AAA TCT GTA TCA AAC TTT ACT TCA 1557 
He Leu Asn Lys Leu Ala Ser Leu Lys Ser Val Ser Asn Phe Thr Ser 
390 395 400 

ATC GTT AAT AAT CTC CAA GAC TCT GTC CAA ACG AAT ATG TCT TTG AAT 1605 
45 He Val Asn Asn Leu Gin Asp Ser Val Gin Thr Asn Met Ser Leu Asn 

405 410 415 

ACC ATT AAC GCT TTG GCT AAT ACA CAA CTT GAA TCA GGT TCT AAA TTT 1653 
Thr He Asn Ala Leu Ala Asn Thr Gin Leu Glu Ser Gly Ser Lys Phe 
420 425 430 



50 



ACG GTG ACT TCT CAA GCA GTA ACA GGT ACA GGT TCA ACC GGA CAA TTG 1701 
Thr Val Thr Ser Gin Ala Val Thr Gly Thr Gly Ser Thr Gly Gin Leu 
435 440 445 450 
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ATC TCT TAT GCG ATG CCA AAT TCT ACT CTT TAC ATG ATG AAA CTA GAT 1749 
He Ser Tyr Ala Met Pro Asn Ser Ser Leu Tyr Met Met Lys Leu Asp 
455 460 465 

AAT TCG AGT GTG GAA AGT GCC TCT CAA GCT ATC AAA AAA TTG ATG GAG 1797 
Asn Ser Ser Val Glu Ser Ala Ser Gin Ala He Lys Lys Leu Met Glu 
470 475 480 

GAA AAA TAA GTG ATT GAC GTT CAC TCA CAT ATT GTT TTT GAT GTT GAT 1645 
Glu Lys Val He Asp Val His Ser His He Val Phe Asp Val Asp 

15 10 

GAT GGT CCT GAA ACT TTA GAA GAA AGT TTA GAC CTC ATT GGT GAA AGT 1893 
Asp Gly Pro Glu Thr Leu Glu Glu Ser Leu Asp Leu He Gly Glu Ser 
15 20 25 

TAC GCC CAG GOG GTA CGT AAG ATT GTT TCA ACA TCC CAT CGT CGT AAG 1941 
Tyr Ala Gin Gly Val Arg Lys He Val Ser Thr Ser His Arg Arg Lys 
30 35 40 45 

GGG ATG TTT GAG ACT CCA GAG GAT AAA ATT TTT GCC AAC TTT AAA AAA 1989 
Gly Met Phe Glu Thr Pro Glu Asp Lys He Phe Ala Asn Phe Lys Lys 
50 55 60 

GTA AAA GCA GAA GCA GAA GCA CTT TAT CCA GAC TTA ACT ATT TAT TAT 2037 
Val Lys Ala Glu Ala Glu Ala Leu Tyr Pro Asp Leu Thr He Tyr Tyr 
20 65 70 75 

GGA GGT GAA CTT TAT TAC ACC TCA GAC ATT GTG GAG AAA CTT GAA AAG 2085 
Gly Gly Glu Leu Tyr Tyr Thr Ser Asp He Val Glu Lys Leu Glu Lys 
80 85 90 



10 



15 



25 



30 



AAT CTC ATT CCG CGC ATG CAC AAC ACT CAA TTT GCT TTA ATT GAG TTT 2133 
Asn Leu He Pro Arg Met His Asn Thr Gin Phe Ala Leu lie Glu Phe 
95 100 105 

AGT GCT CGC ACA TCT TGG AAA GAA ATT CAT AGT GGG CTT AGT AAT GTT 2181 
Ser Ala Arg Thr Ser Trp Lys Glu He His Ser Gly Leu Ser Asn Val 
HO 115 120 125 

TTG AGA GCG GGG GTA ACG CCT ATT GTT GCT CAT ATT GAG CGC TAT GAT 2229 
Leu Arg Ala Gly Val Thr Pro He Val Ala His He Glu Arg Tyr Asp 
130 135 140 

GCC CTC GAA GAA AAT GCT GAC CGT GTT CGA GAA ATC ATC AAT ATG GGC 2277 
Ala Leu Glu Glu Asn Ala Asp Arg Val Arg Glu He He Asn Met Gly 
145 150 155 

35 TGC TAT ACT CAA GTC AAT AGC TCA CAT GTC CTC AAA CCA AAG CTC TTT 2325 

Cys Tyr Thr Gin Val Asn Ser Ser His Val Leu Lys Pro Lys Leu Phe 
160 165 170 

GGA GAT AAA GAT AAA GTA AGA AAG AAA CGT GTT CGC TTT TTC TTG GAG 2373 
Gly Asp Lys Asp Lys Val Arg Lys Lys Arg Val Arg Phe Phe Leu Glu 
175 180 185 

AAA AAT TTG GTT CAT ATG GTT GCT AGC GAC ATG CAT AAT CTT GGG CCG 2421 
Lys Asn Leu Val His Met Val Ala Ser Asp Met His Asn Leu Gly Pro 
190 195 200 205 

AGA CCA CCA TTT ATG AAA GAT GCT TAT GAA ATT GTT AAA AAG AAC TAC 2469 
Arg Pro Pro Phe Met Lys Asp Ala Tyr Glu He Val Lys Lys Asn Tyr 
210 215 220 
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2517 



T ATG AAT CAA GAT AAC ACT AAA 2567 
Met Asn Gin Asp Asn Thr Lys 
1 5 
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AAG CTT TTG ATT CTT TTC ACA GCT TTT TAT TTC GCT GTT TTC AGT TTC 2663 
Lys Leu Leu lie Leu Phe Thr Ala Phe Tyr Phe Ala Val Phe Ser Phe 
25 30 35 

TTA GGT ACT TAT TTC TTT ATC CAA CCA ACA TAT ACA TCA ACA ACG CGT 2711 
Leu Gly Thr Tyr Phe Phe lie Gin Pro Thr Tyr Thr Ser Thr Thr Arg 
40 45 50 55 

ATC TAT GTT GTT AAT CAG GCA ACA GAT AAT AAG AAT CTT TCT GCT CAA 2759 
He Tyr Val Val Asn Gin Ala Thr Asp Asn Lys Asn Leu Ser Ala Gin 
60 65 70 

GAT TTG CAA GCT GGT ACC TAT TTG GCA AAT GAC TAT AAA GAG ATT ATT 2807 
Asp Leu Gin Ala Gly Thr Tyr Leu Ala Asn Asp Tyr Lys Glu lie lie 
75 80 85 

GCA TCA AAT GAT GTA TTA TCA GAA GTT ATT AAA GAT GAA AAA TTG AAT 2855 
Ala Ser Asn Asp Val Leu Ser Glu Val lie Lys Asp Glu Lys Leu Asn 
90 95 100 

TTG AGT GAG GCA GAA CTG TCT AAA ATG GTT TCA GTT AAT ATT CCT ACT 2903 
Leu Ser Glu Ala Glu Leu Ser Lys Met Val Ser Val Asn lie Pro Thr 
105 110 115 

GAT ACT CGT CTT ATT TCA ATT TCT GTT AAT GCT AAA ACT GGT CAA GAT 2951 
Asp Thr Arg Leu lie Ser lie Ser Val Asn Ala Lys Thr Gly Gin Asp 
120 125 130 135 

GCG CAA ACA CTT GCC AAT AAG GTT CGT GAA GTT GCT TCA AAA AAA ATC 2999 
Ala Gin Thr Leu Ala Asn Lys Val Arg Glu Val Ala Ser Lys Lys lie 
140 145 150 

AAG AAG GTG ACA AAA GTT GAA GAT GTC ACA ACG CTC GAA GAA GCT AAA 3047 
Lys Lys Val Thr Lys Val Glu Asp Val Thr Thr Leu Glu Glu Ala Lys 
25 155 160 165 

TTG CCA GAG TCA CCA TCT TCA CCA AAT ATC AAA CTT AAT GTG CTT CTT 3095 
Leu Pro Glu Ser Pro Ser Ser Pro Asn lie Lys Leu Asn Val Leu Leu 
170 175 180 



10 



15 



20 



30 



GGG GCA GTG CTT GGA GGA TTC CTT GCA GTG GTT GGT GTA TTG GTA CGT 3143 
Gly Ala Val Leu Gly Gly Phe Leu Ala Val Val Gly Val Leu Val Arg 
185 190 195 

GAA ATC CTA GAT GAT CGT GTT CGC CGT CCA GAA GAT GTG GAA GAT GCC 3191 
Glu lie Leu Asp Asp Arg Val Arg Arg Pro Glu Asp Val Glu Aap Ala 
200 205 210 215 

CTT GGA ATG ACA CTT CTT GGA ATT GTC CCT GAT ACA GAT AAA ATT TAA 3239 
35 Leu Gly Met Thr Leu Leu Gly lie Val Pro Asp Thr Asp Lys He * 

220 225 230 

GGAGAAGAA ATG CCT TTA TTA AAG TTA GTT AAA TCA AAA GTA GAC TTT 3287 
Met Pro Leu Leu Lys Leu Val Lys Ser Lys Val Asp Phe 
15 10 

nnT a a t\ ann 

40 



45 



50 



55 



GCT 


AAA 


AAG ACG GAA GAG 


TAT 


TAT 


AAC 


GCT 


ATT 


CGC 


ACA 


AAT 


ATT 


CAA 


3335 


Ala 


Lys 


Lys Thr Glu Glu Tyr Tyr Asn Ala 


He 


Arg 


Thr 


Asn 


He 


Gin 






15 




20 










25 












TTT 


TCT 


GGT GCT CAG ATG 


AAA 


GTG 


ATT 


GCG 


ATT 


AGC 


TCT 


GTT 


GAA 


GCT 


3383 


Phe 


Ser 


Gly Ala Gin Met 


Lys Val 


He 


Ala 


He 


Ser 


Ser 


Val 


Glu 


Ala 




30 




35 










40 










45 




GGT 


GAA 


GGA AAA TCA ATG 


ATA 


TCT 


GTT 


AAC 


TTG 


GCG 


ATT 


TCA 


TTT 


GCT 


3431 


Gly Glu 


Gly Lys Ser Met 


He 


Ser 


Val 


Asn 


Leu 


Ala 


He 


Ser 


Phe 


Ala 








50 








55 










60 






AGT 


GTT 


GGG CTC CGA ACA 


CTT 


CTG 


ATT 


GAT 


GCG 


GAA 


ACG 


CGT 


AAT 


TCT 


3479 


Ser 


Val 


Gly Leu Arg Thr 


Leu 


Leu 


He Asp 


Ala 


Glu 


Thr 


Arg 


Asn 


Ser 








65 






70 










75 








GTT 


TTG 


TCA GGT ACA TTT 


AAA 


TCA 


AAT 


GAG 


CCT 


TAT 


AAA 


GGT 


CTT 


TCA 


3527 


Val 


Leu 


Ser Gly Thr Phe 


Lya 


Ser 


Asn 


Glu 


Pro 


Tyr 


Lys 


Gly 


Leu 


Ser 








80 


85 








90 








AAT 


TTC 


CTT TCA GGA AAT 


GCC 


GAT 


CTA 


AAT 


GAA 


ACG 


ATT 


TGC 


CAA 


ACT 


3575 
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5 



10 



20 



30 



40 



50 



Asn 


Phe 
95 


Leu 


Ser 


Gly 


Asn 


Ala 
100 


Asp 


Leu 


Asn 


Glu 


Thr 
105 


He 


Cys 


Gin 


Thr 




GAT 
Asp 
110 


ATT 
He 


TCT 
Ser 


GGT 
Gly 


TTA 
Leu 


GAT 
Asp 
115 


GTT 
Val 


ATT 
He 


GCA 
Ala 


TCT 
Ser 


GGT 
Gly 
120 


CCT 
Pro 


GTT 
Val 


CCA 
Pro 


CCT 
Pro 


AAT 
Asn 
125 


3623 


CCA 
Pro 


ACA 
Thr 


AGT 
Ser 


CTT 
Leu 


TTG 
Leu 
130 


CAA 
Gin 


AAT 
Asn 


GAT 
Asp 


AAT 
Asn 


TTT 
Phe 
135 


AGA 
Arg 


CAT 
His 


TTG 
Leu 


ATG 
Met 


GAA 
Glu 
140 


GTT 
Val 


3671 


GCT 
Ala 


CGT 
Arg 


AGT 
Ser 


TGT 
Cys 
145 


TAT 
Tyr 


GAT 
Asp 


TAT 
Tyr 


GTC 
Val 


ATC 
He 
150 


ATC 
He 


GAT 
Asp 


ACA 
Thr 


CCA 
Pro 


CCA 
Pro 
155 


GTT GGT 
Val Gly 


3719 


CTG 
Leu 


GTT 
Val 


ATT 
lie 
160 


GAT 
Asp 


GCA 

Ala 


GTT 

val 


ATT 
He 


ATT 
He 
165 


GCC 
Ala 


CAT 
His 


CAG 
Gin 


GCT 
Ala 


GAT 
Asp 
170 


GCC 
Ala 


AGT 
Ser 


CTT 
Leu 


3767 


TTG 
Leu 


GTT 
Val 
175 


ACA 
Thr 


GAA 
Glu 


GCT 
Ala 


GGG 
Gly 


AAA 
Lys 
180 


ATT 
He 


AAA 

Lys 


CGT 
Arg 


CGT 
Arg 


TTC 
Phe 
185 


GTA 
Val 


ACT 
Thr 


AAG GCC 
Lys Ala 


3815 


GTT 
Val 
190 


GAA 
Glu 


CAA 
Gin 


TTG 
Leu 


GTA 
Val 


GAA 
Glu 
195 


AGT 
Ser 


GGT 
Gly 


TCT 
Ser 


CAG 
Gin 


TTC 

Phe 
200 


TTA 
Leu 


GGG 
Gly 


GTC 
Val 


GTC 
Val 


CTT 
Leu 
205 


3863 


AAT 
Asn 


AAA 
Lys 


GTT 
Val 


GAC 
Asp 


ATG 
Met 
210 


ACA 
Thr 


GTT 
Val 


GAT 
Asp 


AAA 

Lys 


TAT 

Tyr 
215 


GGA 
Gly 


TTT 
Phe 


TAT 

Tyr 


GGT 
Gly 


TCT 
Ser 
220 


TAC 
Tyr 


3911 


GGA 
Gly 


TCA 
Ser 


TAT 
Tyr 


GGC 
Gly 
225 


GAG 
Glu 


TAT 
Tyr 


GGA 
Gly 


AAA 
Lys 


AAA 
Lys 
230 


TCT 
Ser 


GAC 
Asp 


CAA 
Gin 


AAA 
Lys 


GAA 
Glu 
235 


GGT CAT 
Gly His 


3959 


TCA 
Ser 


AGA 
Arg 


GCA 
Ala 
240 


CAT 
His 


CGT 
Arg 


CGT 
Arg 


AGA 
Arg 


AAA 
Lys 
245 


GTC 
Val 


GGT 
Gly 


TGG 
Trp 


AAT 

Asn 


TAACGCGTTA 




4005 






CTA AGATGTCGTT GGGAACGACA AGTGGAGGGA 


ATGAG ATG TCA CAA 
Met Ser Gin 
1 


4059 


GCT 
Ala 


AAA 
Lys 
5 


GAG 
Glu 


GAA 
Glu 


ATT 
He 


TCA 
Ser 


GAT 
Asp 
10 


GTT 
Val 


ATG 
Met 


ACT 
Thr 


TAT 

Tyr 


TCA 
Ser 
15 


GAG 
Glu 


CTA 
Leu 


ACA 
Thr 


AGT 
Ser 


4107 


CAT 
His 
20 


AAG 
Lys 


CCC 
Pro 


AAA 
Lys 


ATT 
He 


ATT 
He 
25 


TAT 
Tyr 


AGC 
Ser 


TTG 
Leu 


ATT 
He 


AAG 
Lys 
30 


CGG 
Arg 


ATT 
He 


GGT 
Gly 


GAT 
Asp 


ATT 
He 
35 


4155 


TTG 
Leu 


GTT 
Val 


AGT 
Ser 


TCT 
Ser 


ATT 
He 
40 


GGT 
Gly 


TTA 
Leu 


ATT 
He 


ATT 
He 


TTG 
Leu 
45 


ATA 
He 


CCG 
Pro 


CTA 
Leu 


TTT 
Phe 


TTG 
Leu 
50 


ATA 

He 


4203 


GTT 
Val 


GCT 
Ala 


TTG 
Leu 


ATC 
He 
55 


ATG 
Met 


AAA 
Lys 


TGC 
Cys 


TCT 
Ser 


GAA 
Glu 
60 


CCA 
Pro 


ACA 
Thr 


GCA 
Ala 


CCT 
Pro 


ATA 
He 
65 


TTT 
Phe 


TTC 
Phe 


4251 


TCA 
Ser 


CAT 
His 


ATT 
He 
70 


AGA 
Arg 


AAT 
Asn 


GGT 
Gly 


AAA 
Lys 


AAT 
Asn 
75 


GGC 
Gly 


AAA 
Lys 


AAG 
Lys 


TTC 
Phe 


AAA 
Lys 
80 


ATG 
Met 


TAT 
Tyr 


AAA 

Lys 


4299 


TTT 
Phe 


AGA 
Arg 
85 


ACC 
Thr 


ATG 
Met 


TGT 
Cys 


CAG 
Gin 


GAC 
Asp 
90 


GCA 
Ala 


GAA 
Glu 


TCG 
Ser 


ATT 
He 


TTG 
Leu 
95 


ATG 
Met 


AAA 
Lys 


GAT 
Asp 


ACG 
Thr 


4347 


GAA 
Glu 
100 
GAA 
Glu 


CTT 
Leu 

GAT 
Asp 


TTT 
Phe 

CCT 
Pro 


GCA 
Ala 

AGA 
Arg 


AAA 
Lys 

ATT 
He 
120 


TTT 
Phe 
105 
ACA 
Thr 


AAG 
Lys 

AAA 

Lys 


GCA 
Ala 

ATC 
He 


AAT 
Asn 

GGT 
Gly 


GGT 
Gly 

GGC 
Gly 
12S 


TAT 
Tyr 
110 
ATA 
He 


AAA 
Lys 

TTA 
Leu 


CTT 
Leu 

AGG 
Arg 


GAA 
Glu 

AAA 

Lys 


ACG 
Thr 

ACA 
Thr 
130 


CAT 
His 
115 
AGT 
Ser 


4395 
4443 


ATT 
lie 


GAT 
Asp 


GAA 
Glu 


TTG 
Leu 


CCA 
Pro 


CAA 
Gin 


CTG 
Leu 


ATT 
He 


AAT 
Asn 


GTT 
Val 


TTT 
Phe 


TTA 
Leu 


GGA 
Gly 


CAA 
Gin 


ATG 
Met 


TCA 
Ser 


4491 
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135 140 145 

TTA GTG GGT CCA COT CCA CTA CCA GAT AGA GAA ATC ATT GAA TAC GGT 4539 
Leu Val Gly Pro Arg Pro Leu Pro Asp Arg Glu He He Glu Tyr Gly 
5 150 155 160 

GAT AAC CAA GAA AAA TTT TTA AGC GTT AAA CCA GGC ATG ACA GGA TGG 4 587 

Asp Asn Gin Glu Lys Phe Leu Ser Val Lys Pro Gly Met Thr Gly Trp 
165 170 175 

TGG CAA GTT TCA GGG AGA AGT ACT ATT GGG TAT CCT GAG CGG TGT CAT 4635 
Trp Gin Val Ser Gly Arg Ser Thr He Gly Tyr Pro Glu Arg Cys His 
*0 180 185 190 195 

CTT GAG CTT TAT TAT GTA GAA AAG TGT TGT TTT ACT TTC GAT GTT CTT 4 683 

Leu Glu Leu Tyr Tyr Val Glu Lys Cys Cys Phe Thr Phe Asp Val Leu 
200 205 210 

ATA TTA CTT AAG ACA ATT GGG ATT GTT TTG AAG AGA GTT GGA GCG CGT 4 731 

y5 He Leu Leu Lys Thr He Gly He Val Leu Lys Arg Val Gly Ala Arg 

215 220 225 

TAGTACTGAT GAAACAAAAA TTATTATTGA TAATAGAAGC GATGAGTGGT GGAGCCGGTC 4 791 

GTCATGTACA AGACTTGATT AGTCATCTAC CTCAAGAAAA ATTTGATATT TATGTGATTT 4851 

ATTCAAATCA TAGAACAAAT CCTGTTTTTT GGAAAAAATA GTAACG ATG AAT GAG 4 906 
20 Met Asn Glu 

1 

CAA GTA ACT TTT ATT TTA TGT GAT TTT CTC GTA AGA GAA ATT AAA CCG 4 954 
Gin Val Thr Phe He Leu Cys Asp Phe Leu Val Arg Glu He Lys Pro 
5 10 15 

25 AAA TAT GAT TTG CTT GCT TAT CAA TTT ATT TCT AAA AAG ATT AAA GAA 5002 

Lys Tyr Asp Leu Leu Ala Tyr Gin Phe He Ser Lys Lys He Lys Glu 
20 25 30 35 

ATC AAA CCA GAT ATT GTA CAT TGT CAC AGT TCA AAA GCT GGT GTT ATT 5050 
He Lys Pro Asp He Val His Cys His Ser Ser Lys Ala Gly Val He 
40 45 50 

30 GGT CGT TTA GCT GCC AAA AGA CGA GGT GTT AAA AAA ATA TTT TAT ACG 5098 

Gly Arg Leu Ala Ala Lys Arg Arg Gly Val Lys Lys He Phe Tyr Thr 
55 60 65 

CCA CAT GCT TAT TCG TTT TTG GCA CCT GAA TTT AGT GGG AAG AAA AAG 5146 
Pro His Ala Tyr Ser Phe Leu Ala Pro Glu Phe Ser Gly Lys Lys Lys 
70 75 80 



35 



40 



45 



50 



TTT CTA TTT GTT CAA ATT GAA AAG TTT TTA AGC CGA TTT GCG ACA ACT 5194 
Phe Leu Phe Val Gin He Glu Lys Phe Leu Ser Arg Phe Ala Thr Thr 
85 90 95 

AAG ATA TTT TGT GTG TCA ATA GCG GAA ATG CAA GCT GCT CTT GAA GTA 5242 
Lye He Phe Cys Val Ser He Ala Glu Met Gin Ala Ala Leu Glu Val 
100 105 110 115 

AAT CTA GAT AAA ACC GAT AAG TTT CAG GTA ATT TAT AAT GGT TTG CCA 5290 
Asn Leu Asp Lys Thr Asp Lys Phe Gin Val He Tyr Asn Gly Leu Pro 
120 125 130 

5338 



5386 
5434 

5482 



GAA ATT GAT TTA CCA 


AGC 


AAA 


GAA ACG ATT 


CGG 


GCG 


CAA 


TTA 


GGA 


CTG 


Glu He Asp Leu Pro 


Ser 


Lys 


Glu Thr He 


Arg 


Ala 


Gin 


Leu 


Gly 


Leu 


135 






140 






145 




GAA AAG GCA GCA GTT 


GTT 


ATA 


GGC AAT AAT 


GCA 


AAA 


ATG 


TCG 


GAA 


CAG 


Glu Lys Ala Ala Val 


Val 


He 


Gly Asn Asn 


Ala 


Lys 


Met 


Ser 


Glu 


Gin 


150 






155 




160 








AAA AAT CCT ATG TTT 


TTT 


ATG 


GAA ATT GCC 


CGA 


AAA 


ATG 


ATT 


AGA 


CAA 


Lys Asn Pro Met Phe 


Phe 


Met 


Glu He Ala 


Arg 


Lys 


Met 


He 


Arg 


Gin 


165 




170 




175 








AAC GCA AAT TGG CAT 


TTT 


GTG 


TGG GTA GGT 


GAT 


GGT 


CAG 


CTG 


ATG 


CCA 


Asn Ala Asn Trp His 


Phe 


Val 


Trp Val Gly 


Asp 


Gly 


Gin 


Leu 


Met 


Pro 


160 


185 




190 








195 



55 
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10 



15 



CTT TTT CAA TCA TTT ATT AAG CAA AAT GGA CTA GAG GGA AAT ATC CAT 5530 
Leu Phe Gin Ser Phe lie Lys Gin Asn Gly Leu Glu Gly Asn lie His 
200 205 210 

TTG CTT GGC GAG CGT CCT GAT AGT GAA ATA GTT GTG ACA GCC TAT GAC 5578 
Leu Leu Gly Glu Arg Pro Asp Ser Glu lie Val Val Thr Ala Tyr Asp 
215 220 225 

ATC TTC TTG ACG ACT TCC CAA TAT GAA GGT TTA CCT TAT GCA CCA ATT 5626 
He Phe Leu Thr Thr Ser Gin Tyr Glu Gly Leu Pro Tyr Ala Pro He 
230 235 240 

GAA GCG ATG CGA GCT GGT GTC CCG ATT CTT GCG ACA AAA GTT GTT GGC 5674 
Glu Ala Met Arg Ala Gly Val Pro He Leu Ala Thr Lys Val Val Gly 
245 250 255 

AAT AGT GAG CTT GTG ATA GAG GGC AAA AAT GGT TAT TTG ATT GAC TTA 5722 
Aan Ser Glu Leu Val He Glu Gly Lys Asn Gly Tyr Leu He Asp Leu 
260 265 270 275 

GAG TGG TCA AAA TCT GTC GAA GAA AAA TTA TAT AAG GCA GCG AAA ATA 5770 
Glu Trp Ser Lys Ser Val Glu Glu Lys Leu Tyr Lys Ala Ala Lys He 
280 285 290 

GAT GCA CAA ATG ATT AAA GCA GAT TTT AGG CAA AGG TTT GCG ATT GAT 5818 
Asp Ala Gin Met He Lys Ala Asp Phe Arg Gin Arg Phe Ala He Asp 
295 300 305 

CAG ATA TTA AAG CAA ATT GAA ACA ATT TAT TTA GCT TGAATGAAGA 5864 
Gin He Leu Lys Gin He Glu Thr He Tyr Leu Ala 
310 315 



ATGAGGAGGC 


ATAAATGCTG 


ATTTTGAAAT 


TAAAATTTCA 


TCTTAATTGG 


TACACAAACG 


5924 


AAAACCATTA 


TTACACGTGA 


GTATTCGAAG 


ACCTGGAAAC 


GAGGCGATGA 


GCCGTATTAT 


5984 


CCAGTGAACA 


ATGATCGTAA 


CAACAAACTC 


TATACTGCCT 


ATAAGCGTCT 


TGCCGAGCAA 


6044 


CAAGAGAATG 


TCATTTTCGG 


TGGACGTCTA 


GGTCACTACC 


GTTACTACGA 


TATGCACCAG 


6104 


GTAATTGGAG 


CTGCCTTGCA 


GTGTGTCAGA 


AATGAAGTGA 


AGTAAATCTT 


GATGAAGTTG 


6164 


AATAACTTTA 


AGTAATTTTA 


TACTTAATCC 


AATTGATGAA 


AATATTTTTG 


TATCGATTTA 


6224 


TCTTCTGTAA 


GAAGAGTCCT 


AATCGTTTAA 


AAAATGTACA 


ATTGAGTTTT 


TATATTTTTA 


6284 


AATAAAGTTA 


CTTTTAAGTC 


GTGTTATAGA 


ATATACATGA 


ATAGGTGTAT 


TAGAAAATTT 


6344 


ATTAATCTAA 


TCCTCGAAAA 


TAACTGACTG 


TAAGGAATCA 


AGTTGTGGAG 


TGTAAGTTGT 


6404 


CAAATGGAGA 


GGAAAATAAT 


ATG AAA AAA ATT TCA ATT TTA CAC TTT TCC 
Met Lys Lys He Ser He Leu His Phe Ser 


6454 



25 



30 



35 



10 

CAA GTA TCA GGC GGG GGA GTT GAA AAG TAC ATA AAA TTA TTT TTA AAG 6502 
40 Gin Val Ser Gly Gly Gly Val Glu Lys Tyr He Lys Leu Phe Leu Lys 

15 20 25 

TAT TCT GAT GTG ACA AAA TTT AAT AAT TAT TTA GTT GCA CCT AAT CTT 6550 
Tyr Ser Asp Val Thr Lys Phe Asn Asn Tyr Leu Val Ala Pro Asn Leu 
30 35 40 

45 GAA AAT TAT GAC GAA TTT AAT GGA TAT TTA AAG ATG TCT GTC AAT TTT 6598 

Glu Asn Tyr Asp Glu Phe Asn Gly Tyr Leu Lys Met Ser Val Asn Phe 
45 50 55 

AAT ATG GAA CAA ACT TTT TCT CCG CTA AAA ATA TTC AAA AAT GTC TTT 6646 

Asn Met Glu Gin Thr Phe Ser Pro Leu Lys He Phe Lys Asn Val Phe 
60 65 70 

50 

TTT ATT CGT AGT GTA CTC AAA AAA ATA AAC CCA GAT ATA GTA TAC CTA 6694 

Phe He Arg Ser Val Leu Lys Lys He Asn Pro Asp He Val Tyr Leu 
75 80 85 90 
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6742 

6790 

6838 

6886 

6934 

6982 

7030 

7078 

7126 

7174 

7222 

7270 

7318 

7366 

7414 

7462 

7510 
7560 

AGGTTATTTG ATTGACTTAG AGTGGTCAAA ATCTGTCGAA GAAAAATTAT ATAAGGCAGC 7620 

50 

GAAAATGGAT GCACAAATGA TTAAAGCAGA TTTTAGGCAA AGGTTTGCGA TTGATCAGAT 7680 
GTTAAAGCAA ATTAAAACAA TTTATTTAGC TTGAATGAAG AAAGAGGAGG CATAA ATG 7738 



55 





CAT 
His 


AGT 
Ser 


ACA 
Thr 


TTT 
Phe 


GCA 
Ala 
95 


GGT 
Gly 


GTC 
Val 


GTA 
Val 


GGT 
Gly 


CGT 
Arg 
100 


ATT 
He 


GCT 
Ala 


TCA 
Ser 


ATA 
He 


GGT 
Gly 
105 


TTG 
Leu 


5 


CCA 
Pro 


ACA 
Thr 


AAA 
Lys 


GTA 
Val 
110 


GTA 
Val 


TAC 
Tyr 


AAT 
Asn 


CCT 
Pro 


CAC 
His 
115 


GGA 
Gly 


TGG 
Trp 


TCC 
ser 


TTC 
Phe 


AAA 
Lys 
120 


ATG 
Met 


GAC 
Asp 




AAC 
Asn 


AGC 
Ser 


TAT 
Tyr 
125 


TTG 
Leu 


AAA 
Lys 


AAG 
Lys 


CTT 
Leu 


ATT 
He 
130 


TTT 
Phe 


AAA 
Lys 


TTA 
Leu 


ATC 
He 


GAA 
Glu 
135 


TTT 
Phe 


TCT 
Ser 


TTA 
Leu 


10 


TCT 
Ser 


TTT 
Phe 
140 


TTA 
Leu 


ACT 
Thr 


GAT 
Asp 


AAG 
Lys 


TTT 
Phe 
145 


ATT 
He 


TTA 
Leu 


ATT 
He 


TCG 
Ser 


GAA 
Glu 
150 


TCT 
Ser 


GAG 
Glu 


TAT 
Tyr 


ATT 
He 


15 


TTG 
Leu 
155 


GCT 
Ala 


AAC 
Asn 


CAT 
His 


ATT 
He 


TCA 
Ser 
160 


TTT 
Phe 


AAT 
Asn 


AAA 
Lys 


AGC 
Ser 


AAG 
Lys 
165 


TTT 
Phe 


TCA 
Ser 


CTA 

Leu 


ATT 
He 


AAT 
Asn 
170 


AAT 
Asn 


GGT 
Gly 


GTT 
Val 


GAA 
Glu 


GTG 
Val 
175 


ATT 
He 


ACA 

Thr 


GGG 
Gly 


GAT 
Asp 


TCA 
Ser 
180 


AGA 
Arg 


AAT 
Asn 


GAG 
Glu 


ATA 
He 


GAA 
Glu 
185 


GAG 
Glu 


20 


ATA 
He 


TTT 
Phe 


CCA 
Pro 


AAT 
Asn 
190 


GAG 
Glu 


GAT 
Asp 


TTT 
Phe 


ATA 
He 


ATT 
He 
195 


GGC 
Gly 


ATG 
Met 


GTT 
Val 


GGC 
Gly 


AGA 
Arg 
200 


CTA 
Leu 


AGC 
Ser 




CCA 
Pro 


CCC 
Pro 


AAA 
Lys 
205 


GAG 
Glu 


TTT 
Phe 


TTC 
Phe 


TTT 
Phe 


TTT 

Phe 
210 


ATT 
He 


GAT 
Asp 


TTT 
Phe 


GCA 
Ala 


AAA 
Lys 
215 


AAA 
Lys 


ATA 
He 


TTA 
Leu 


25 


CAA 
Gin 


ATT 
He 
220 


CGA 
Arg 


AAC 
Asn 


GAT 
Asp 


ACC 
Thr 


AAT 
Asn 
225 


TTT 
Phe 


ATT 

He 


ATC 
He 


GTG 
Val 


GGT 
Gly 
230 


GAT 
Asp 


GGA 
Gly 


GAG 
Glu 


TTA 

Leu 




CGA 
Arg 
235 


AGT 
Ser 


GAA 
Glu 


ATA 
He 


GAA 
Glu 


AGA 
Arg 
240 


ATG 
Met 


ATA 
He 


CTA 
Leu 


GAT 
Asp 


AAT 
Asn 
245 


GGG 
Gly 


TTA 
Leu 


GGA 
Gly 


GAT 
Asp 


AAA 

Lys 
250 


30 


ATC 
He 


TAT 
Tyr 


ATT 
He 


ACT 
Thr 


GGG 
Gly 
255 


TGG 
Trp 


GTT 
Val 


GAT 
Asp 


AAT 
Asn 


CCG 
Pro 
260 


AGA 
Arg 


AAC 
Asn 


TAT 
Tyr 


ATA 
He 


GAG 
Glu 
265 


AAG 
Lys 




TTT 
Phe 


GAT 
Asp 


CAA 
Gin 


GCT 
Ala 
270 


ATT 
He 


CTG 
Leu 


TTT 
Phe 


TCT 

Ser 


AGA 
Arg 
275 


TGG 
Trp 


GAG 
Glu 


GGT 
Gly 


CTT 
Leu 


AGC 
Ser 
280 


CTA 
Leu 


ACG 
Thr 


35 


ATT 
He 


GCG 
Ala 


GAA 
Glu 
285 


TAT 
Tyr 


ATG 
Met 


TCT 
Ser 


CAG 
Gin 


AAG 
Lya 
290 


AAA 
Lys 


ACA 
Thr 


ATT 
He 


TTA 
Leu 


GCA 
Ala 
295 


ACA 
Thr 


AAT 
Asn 


ATT 
He 




GGT 
Gly 


GGC 
Gly 
300 


ATT 
He 


AAT 
Asn 


GAT 
Asp 


TTA 

Leu 


ATC 
He 
305 


ACT 
Thr 


GAT 
Asp 


GGT 
Gly 


GAA 
Glu 


ACA 
Thr 
310 


GGA 
Gly 


ATG 
Met 


CTG 
Leu 


ATT 
He 


40 


GAA 
Glu 
315 


GTT 
Val 


GGA 
Gly 


GAC 
Asp 


TTG 
Leu 


AAT 
Asn 
320 


TCA 
Ser 


GCA 
Ala 


GTA 
Val 


TCT 
Ser 


AAA 
Lys 
325 


TCT 
Ser 


TTC 
Phe 


GAG 
Glu 


CTA 
Leu 


AGA 
Arg 
330 




AAT 
Asn 


AAT 
Asn 


AAA 

Lys 


GAG 
Glu 


GTT 
Val 
335 


TCG 
Ser 


AAT 

Asn 


CAA 
Gin 


TTA 
Leu 


GCG 
Ala 
340 


AAT 
Asn 


AAC 
Asn 


GCT 
Ala 


TAT 
Tyr 


AAT 
Asn 
345 


AAA 
Lys 


45 


GTT 
Val 

TTA 

Leu 


GTT 
Val 

TTT 
Phe 


GAA 
Glu 

ATA 
He 
365 


CAG 
Gin 
350 
GAG 
Glu 


TTT 
Phe 

ATG 
Met 


TCG 
Ser 

TGT 
Cys 


ATT 
He 

AAC 
Asn 


GAA 
Glu 

AAT 
Asn 
370 


AAA 
Lys 
355 
GAG 
Glu 


CAG 
Gin 

AAA 
Lys 


ATG GCT GAG ATA GAA AGT 
Met Ala Glu He Glu Ser 
360 

TAGAGACTTA AAGAAAATAC 
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Met 

1 

CTG ATT TTG AAA TTA AAA TTT CAT CTT AAA TCG TTA TTC CTT AAA TGG 7786 
c Leu lie Leu Lys Leu Lys Phe His Leu Lys Ser Leu Phe Leu Lys Trp 

5 5 10 15 

ATT TAT CGA TTA CTT TAT CTA AAA AAG TTT CAG TTT GGT GCA CGC TTG 7834 
lie Tyr Arg Leu Leu Tyr Leu Lys Lys Phe Gin Phe Gly Ala Arg Leu 
20 25 30 

ACG TTT CGA GAT GGG TTT CAT TTG TTA ATT GAA AAA TCT GGG AAA GTT 7882 
10 Thr Phe Arg Asp Gly Phe His Leu Leu lie Glu Lys Ser Gly Lys Val 

35 40 45 

ATC ATC GGG AAT CAT GTT TTT TTT AAT AAC TTT TGT TCA ATT AAT GCC 7 930 

He He Gly Asn His Val Phe Phe Asn Asn Phe Cys Ser He Asn Ala 
50 55 60 65 



15 



ATG TTA TCA GTA ACG ATT GGT GAT GAC TGT ATT TTT GGT GAA AAC GTT 7978 
Met Leu Ser Val Thr He Gly Asp Asp Cys He Phe Gly Glu Asn Val 
70 75 80 

AAA ATT TAT GAT CAC AAT CAT TGT TAT CAA AAT AAA AGT CAA CCT ATT 8026 
Lys He Tyr Asp His Asn His Cys Tyr Gin Asn Lys Ser Gin Pro He 
85 90 95 

20 TCA AAA CAA GGT TTT TCA ACT GCT GCT ATC CAG ATT GGT CGT AAC TGT 8074 

Ser Lys Gin Gly Phe Ser Thr Ala Ala He Gin He Gly Arg Asn Cys 
100 105 110 

TGG ATA GGT AGT CAA GTG ACG ATT TTA AAA GGT GTA ACC ATA GGT GAT 8122 
Trp He Gly Ser Gin Val Thr He Leu Lys Gly Val Thr He Gly Asp 
115 120 125 



25 



30 



35 



40 



45 



50 



AAT AGT ATC ATT GGT GCT GGT GTG GTA GTT TAT CAA GAT GTG CCA GAA 8170 
Asn Ser He He Gly Ala Gly Val Val Val Tyr Gin Asp Val Pro Glu 
130 135 140 145 

AAT TCG ATT GTT TTA TCT AAT GGA GAA ATT AGA AAG CGT GGC 8212 
Asn Ser He Val Leu Ser Asn Gly Glu He Arg Lys Arg Gly 
150 155 

TAATTAAA ATG TAT CTT AAA AGT CTA ATC TCT ATT GTT ATT CCA GTA TAT 8262 
Met Tyr Leu Lys Ser Leu He Ser He Val He Pro Val Tyr 
15 10 

8310 



8358 

8406 

8454 

8502 
8550 

8598 

8646 



AAT 


GTA 


GAG 


AAA 


TAT 


TTA 


GAA 


AAA 


TGT 


TTG 


CAA 


TCT 


GTT 


CAA 


AAT 


CAG 


Asn 


Val 


Glu 


Lys 


Tyr 


Leu 


Glu 


Lys 


Cys 


Leu 


Gin 


Ser 


Val 


Gin 


Asn 


Gin 


15 










20 






25 










30 


ACT 


TAC 


AAT 


AAT 


TTT 


GAA 


GTG 


ATT 


TTA 


GTG 


AAT 


GAT 


GGC 


TCA 


ACC 


GAT 


Thr 


Tyr 


Asn 


Asn 


Phe 


Glu 


Val 


He 


Leu 


val 


Asn 


Asp 


Gly 


Ser 


Thr 


Asp 










35 










40 






45 


TCA 


TCA 


CTT 


TCA 


ATA 


TGC 


GAA 


AAA 


TTT 


GTT 


AAT 


CAG 


GAT 


AAA 


AGA 


TTT 


Ser 


Ser 


Leu 


Ser 


He 


Cys 


Glu 


Lys 


Phe 


Val 


Asn 


Gin 


Asp 


Lys 


Arg 


Phe 








50 










55 








60 




TCT 


GTT 


TTT 


TCT 


AAA 


GAA 


AAT 


GGT 


GGT 


ATG 


TCA 


TCT 


GCA 


CGA 


AAT 


TTT 


Ser 


Val 


Phe 


Ser 


Lys 


Glu 


Asn 


Gly 


Gly 


Met 


Ser 


Ser 


Ala 


Arg 


Asn 


Phe 






65 










70 








75 






GGA 


ATT 


AAA 


AAG 


GCT 


AAA 


GGA 


TCG 


TTT 


ATC 


ACA 


TTT 


GTA 


GAT 


AGT 


GAT 


Gly 


He 


Lys 


Lys 


Ala 


Lys 


Gly 


Ser 


Phe 


He 


Thr 


Phe 


val 


Asp 


Ser 


Asp 




80 










85 










. 90 






GAC 


TAC 


ATA 


GTA 


AAA 


GAT 


TAT 


CTT 


TCT 


CAT 


TTG 


GTA 


GCT 


GGG 


ATA 


AAA 


Asp 


Tyr 


He 


Val 


Lys 


Asp 


Tyr 


Leu 


Ser 


His 


Leu 


Val 


Ala 


Gly 


He 


Lys 


95 










100 










105 








110 


AGT 


GAG 


ACC 


TCT 


ATA 


GTT 


TGT 


TCA 


AAG 


TTT 


TTT 


CTT 


GTA 


GAT 


GAA 


AAA 


Ser 


Glu 


Thr 


Ser 


He 


Val 


Cys 


Ser 


Lys 


Phe 


Phe 


Leu 


Val 


Asp 


Glu 


Lys 










115 










120 








125 


GGA 


AGT 


TTA 


TTG 


ACT 


AAA 


AAA 


GAG 


GCA 


CCT 


AAA 


AAG 


AAA 


TCA 


GAA 


GTC 


Gly 


Ser 


Leu 


Leu 


Thr 


Lys 


Lys 


Glu 


Ala 


Pro 


Lys 


Lys 


Lys 


Ser 


Glu 


Val 
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130 135 140 

GTT TCA ATT GAG GAA AGT ATT AAA ATT CTT CTG TTG CAA CAA AAT GGC 8694 

Val Ser lie Glu Glu Ser lie Lys lie Leu Leu Leu Gin Gin Asn Gly 

145 150 155 

5 

TAT GAT CTC GCT GTC TGG GGA AAA TTA TAC CCC GTT TCT TTC TTT GAA 8742 

Tyr Asp Leu Ala Val Trp Gly Lys Leu Tyr Pro Val Ser Phe Phe Glu 

160 165 170 

ACA ATT TCT TTC CCA GAA GGA AAA CTT TAC GAA GAT ATG GGA ACA ACT 8790 
Thr lie Ser Phe Pro Glu Gly Lys Leu Tyr Glu Asp Met Gly Thr Thr 
10 175 180 185 190 

TAC AAA TTA CTA AAA TTG GCA AGT GAA GTG GTC TTC TTG GAT GCG TAT 8838 
Tyr Lys Leu Leu Lys Leu Ala Ser Glu Val Val Phe Leu Asp Ala Tyr 
195 200 205 



15 



GAT TAT GCC TAC GTA CAG CGA CCT AAT AGT ATC ATG AAT AGT TCT TTT 8886 
Asp Tyr Ala Tyr Val Gin Arg Pro Asn Ser lie Met Asn Ser Ser Phe 
210 215 220 

AAT TTG AAA AAG TTG GAT ATA ATA GAA ATG GTT CAT GAA ATG GAA AAC 8934 
Asn Leu Lys Lys Leu Asp lie He Glu Met Val His Glu Met Glu Asn 
225 230 235 

GAT ATA TTA GCA CAG TTT CCA AAT TTA GCA TTA TAT GTT AAG AAT CGA 8982 
20 Asp lie Leu Ala Gin Phe Pro Asn Leu Ala Leu Tyr Val Lys Asn Arg 

240 245 250 

GCA TTT GCC GCG GAA GTG AAA ATC TTT TTA GAG ATT CCA AAA GAA AAA 9030 
Ala Phe Ala Ala Glu Val Lys He Phe Leu Glu He Pro Lys Glu Lys 
255 260 265 270 



25 



GAA TTT GAG CAA GCG CAA AAG CAA CTT TGG CAT GAT ATC AAA AAG AAT 9078 
Glu Phe Glu Gin Ala Gin Lys Gin Leu Trp His Asp He Lys Lys Asn 
275 280 285 

AGA AAA GCA CCA TTT ATG ACA AAA GGT GCT AGA TTG AAG AAT AGG CTC 9126 
Arg Lys Ala Pro Phe Met Thr Lys Gly Ala Arg Leu Lys Asn Arg Leu 
290 295 300 

30 GGA GCT AGT CTG TCG TTT TTA GGT AAA TCT TTA TTT TTG ACT ATT GGG 9174 

Gly Ala Ser Leu Ser Phe Leu Gly Lys Ser Leu Phe Leu Thr He Gly 
305 310 315 

AAG CAG TTA GTA GAT AGA TAATGATATT GAAAGCGATA CGATACAATC 9222 
Lys Gin Leu Val Asp Arg 
320 

35 GTAAACTTCT TTTGGTGTTG ACTAGGAGTT AGCTTGAAAT TTGAATATAA AGGAAGCAAC 9282 

AC ATG GTA ATT TAT TTT TTA CTT TTC CCG ATG ATC GCA ATG ATT TAT 9329 
Met Val He Tyr Phe Leu Leu Phe Pro Met He Ala Met He Tyr 
15 10 15 

TTA ATG ACA TTG CTC TTA CGG CAA AAA GCA CAA ATC CAA AAA ACG ATT 9377 
40 Leu Met Thr Leu Leu Leu Arg Gin Lys Ala Gin He Gin Lys Thr He 

20 25 30 

TTT TGT GTT CTT ACG TTT GGT ACA CTA GGC TTT ATT TCA GCA AGT CGT 9425 
Phe Cys Val Leu Thr Phe Gly Thr Leu Gly Phe He Ser Ala Ser Arg 
35 40 45 



45 



50 



GCA TCA AGT GTT GGG ACG GAC GTT ACT TTA TAC GAA AAT ATT TTT AAA 9473 
Ala Ser Ser Val Gly Thr Asp Val Thr Leu Tyr Glu Asn He Phe Lys 
50 55 60 

TCT ATA AAT TAC GGG ATA AGT GCT GAG AAT AAT TGG GGA TAC GTC ATC 9521 
Ser He Asn Tyr Gly He Ser Ala Glu Asn Asn Trp Gly Tyr Val He 
65 70 75 

TAT AAC AAG CTG ATT GGT AGT GTA TTT GGC TAT ACA GGA CAT GAA ATC 9569 
Tyr Asn Lye Leu He Gly Ser Val Phe Gly Tyr Thr Gly His Glu He 
80 85 90 95 
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ACG GCC GCT AAT TCA GTT TTG ATT ACA ATA CTT ATT GGT ATT TTT ATT 
Thr Ala Ala Asn Ser Val Leu lie Thr lie Leu lie Gly lie Phe lie 
100 105 110 



9617 



TGG AAA GTA GCG GAA CAT TAT TTT GTT GCG ACG TTT TTA TAG ATT AGC 
Trp Lys Val Ala Glu His Tyr Phe Val Ala Thr Phe Leu Tyr lie Ser 
115 120 125 



9665 



10 



TTG TTT TAT TAT GCT ACA AGT TTT AAT ATT TCA AGA CAA TTT ATT GCC 9713 
Leu Phe Tyr Tyr Ala Thr Ser Phe Asn lie Ser Arg Gin Phe lie Ala 
130 135 140 

ATG GGG CTT GTA TTG GTA GCA ATT TCT TTT GCT TTA GAT AAA AAG GTT 9761 
Met Gly Leu Val Leu Val Ala lie Ser Phe Ala Leu Asp Lys Lys Val 
145 150- 155 



15 



ATG CCT TGG TTT ATC TTG ACA GTT TTG GCT ACC TTA TTT CAT GCG ACA 9809 
Met Pro Trp Phe He Leu Thr Val Leu Ala Thr Leu Phe His Ala Thr 
160 165 170 175 

GCA ATC GTT GCT TTT CCT GTC TAT TGG CTT ACA AAA GTA CAT TGG GAT 9B57 
Ala He Val Ala Phe Pro Val Tyr Trp Leu Thr Lys Val His Trp Asp 
1B0 185 190 



20 



GTG AAA AAG ACA TTA AGT ATT TTT CCA ATC ACG ATT TTT GCA AGT TTT 9905 

Val Lys Lys Thr Leu Ser He Phe Pro He Thr He Phe Ala Ser Phe 

195 200 205 

ATT TTT GAT GCT ATT TTA AAC ATT TTT GTA CGT TTT TTC CCA CAT TAT 9953 

He Phe Asp Ala He Leu Asn He Phe Val Arg Phe Phe Pro His Tyr 
210 215 220 



25 



GAG ATG TAT ATC ACT GGA ACA CAA TTT AAT ATT TCA GAT CAG GGG CAG 
Glu Met Tyr He Thr Gly Thr Gin Phe Asn He Ser Asp Gin Gly Gin 
225 230 235 



10001 



30 



GGA CGT GTG GTT TTG GTC AAA ATA TTT ATC TTG CTC ATT TTG TTT ACT 10049 

Gly Arg Val Val Leu Val Lys He Phe He Leu Leu He Leu Phe Thr 
240 245 250 255 

TTA TTC TTG TTT TAT AAA AAA AGC TAT GCT TTG ATT TCT GAA TGT CAT 10097 

Leu Phe Leu Phe Tyr Lys Lys Ser Tyr Ala Leu He Ser Glu Cys His 
260 265 270 

CAA AGT TTG ATA GCT TTG ACA ACC GTT GGA TTA AGT ATC GGT ATT GTA 10145 

Gin Ser Leu He Ala Leu Thr Thr Val Gly Leu Ser He Gly He val 

275 280 285 



35 



TTT TAT AAT AAT ATT TTA CTC AAT AGA ATA GAA ATG TTT TAT TCA ATT 
Phe Tyr Asn Asn He Leu Leu Asn Arg He Glu Met Phe Tyr Ser He 
290 295 300 



10193 



40 



TTA AGC ATC GTA TTT ATT CCA ATT GCT ATA GAT TAC ATT AGT TTG AAA 10241 
Leu Ser He Val Phe He Pro He Ala He Asp Tyr He Ser Leu Lys 
305 310 315 

TTT AAA CAA AAA GAT GCT GTG CGA CTA ATG CTG ACG ATA GGT ATT TTG 1028 9 

Phe Lys Gin Lys Asp Ala Val Arg Leu Met Leu Thr He Gly He Leu 
320 325 330 335 



45 



TTA ATT ACA CTT GTG CCT TAC TAT ATA CAG GTT AGC GGT AAT TAT TCA 10337 
Leu He Thr Leu Val Pro Tyr Tyr He Gin Val Ser Gly Asn Tyr Ser 

340 345 350 

GGA ATA TTG CCT TAT GTT ATT CAA CAA TAAAAAATAA AGTTTAGAGA 10384 
Gly He Leu Pro Tyr Val He Gin Gin 
355 360 



50 



GGAAATA ATG GAG GAT AGA AAG AAA CAA GTA ATT TTG ATA CTA TCC CAC 10433 
Met Glu Asp Arg Lys Lys Gin Val He Leu He Leu Ser His 
15 10 

AGA AAT ACT CTC GCT CTA AAA TCA ACA ATA GAG CTT TTG GAT TCT CAA 10481 
Arg Asn Thr Leu Ala Leu Lys Ser Thr He Glu Leu Leu Asp Ser Gin 
15 20 25 30 



55 



24 



EP 0 750 043 A1 



10 



15 



20 



25 



35 



45 



TAC 
Tyr 


TTT 

Phe 


GAT 
Asp 


TTC 
Phe 


TTT 

Phe 
35 


CTT 
Leu 


CAT 
His 


ATA 
He 


GAT 
Asp 


AAA 
Lys 
40 


AAA 

Lys 


AGT 
Ser 


AGA 
Arg 


ATT 
He 


CAA 
Gin 
45 


GAT 
Asp 


10529 


TTT 
Phe 


TTT 
Phe 


TAT 
Tyr 


TTA 
Leu 
50 


AAA 
Lya 


AAA 
Lys 


ATT 
He 


ACA 
Thr 


AAA 
Lys 
55 


TTC 

Phe 


TCC 
Ser 


ACT 
Thr 


ATT 
He 


CAT 
His 
60 


TTT 
Phe 


TCA 
Ser 


10577 


GAA 
Glu 


AGA 
Arg 


AAA 
Lys 
65 


AAT 

Asn 


GTA 
Val 


CAT 
His 


TGG 
Trp 


GGA 
Gly 
70 


GGT 
Gly 


TTT 
Phe 


TCT 
Ser 


ATG 
Met 


GTA 
Val 
75 


GAA 
Glu 


GCA 
Ala 


ATG 
Met 


10625 


TTT 
Phe 


GCG 
Ala 
80 


CTA 
Leu 


TTA 
Leu 


GAA 
Glu 


TGT 
Cys 


GCA 
Ala 
85 


CGT 
Arg 


GAT 
Asp 


ACA 
Thr 


GGA 
Gly 


GAA 
Glu 
90 


TAT 
Tyr 


TCT 
Ser 


TAT 
Tyr 


TTT 
Phe 


10673 


CAT 
His 
95 


TTT 
Phe 


TTA 
Leu 


TCT 
Ser 


GGA 
Gly 


GAT 
Asp 
100 


GAT 
Asp 


ATG 
Met 


CCA 
Pro 


ATC 
He 


AAA 
Lys 
105 


GAT 
Asp 


AAT 
Asn 


GAA 
Glu 


ATA 
He 


GTA 
Val 
110 


10721 


TTT 
Phe 


AAT 
Asn 


TTT 
Phe 


TTT 
Phe 


GAA 
Glu 
115 


AAT 
Asn 


AGT 
Ser 


TAT 
Tyr 


CCT 
Pro 


AAA 
Lys 
120 


AAT 
Asn 


TTT 
Phe 


ATT 

He 


GAT 
Asp 


ATT 
He 
125 


CTA 
Leu 


10769 


GAT 
Asp 


TTT 
Phe 


GAA 
Glu 


AAT 

Asn 
130 


GTC 
Val 


AAT 
Asn 


AAA 
Lys 


AAT 
Asn 


TCA 
Ser 
135 


TAT 
Tyr 


TTC 
Phe 


TAC 
Tyr 


GAA 
Glu 


CCC 
Pro 
140 


CCT 
Pro 


GAG 
Glu 


10817 


ATG 
Met 


ATA 
lie 


GAG 
Glu 
145 


GAG 
Glu 


AGA 
Arg 


GTG 
Val 


AAG 
Lys 


TAC 
Tyr 
150 


TAC 
Tyr 


TAT 
Tyr 


CCT 
Pro 


CAT 
His 


ATG 
Met 
155 


GAT 
Asp 


ATT 
He 


CTA 
Leu 


10865 


AAC 
Asn 


AGA 
Arg 
160 


AAA 

Lys 


GGA 
Gly 


ACA 
Thr 


AAT 

Asn 


TTC 
Phe 
165 


ATA 
He 


GGG 
Gly 


AAA 
Lys 


AAA 
Lys 


CTA 
Leu 
170 


ATT 

He 


TAT 
Tyr 


CTA 
Leu 


CAA 
Gin 


10913 


AAA 
Lys 
175 


TTG 
Leu 


TTG 
Leu 


AAA 
Lys 


GTT 

val 


AAT 
Asn 
180 


CGC 
Arg 


TTG 
Leu 


AAA 
Lys 


AAT 
Asn 


AGA 
Arg 
185 


GAG 
Glu 


ATA 
He 


GAA 
Glu 


ATT 

He 


TTC 
Phe 
190 


10961 


AAG 
Lys 


GGT 
Gly 


CAT 
His 


CAA 
Gin 


TGG 
Trp 
195 


TGT 

Cys 


AGT 
Ser 


TTG 
Leu 


ACA 
Thr 


AAT 
Asn 
200 


CAA 
Gin 


TTT 
Phe 


GTA 
Val 


GAT 
Asp 


ATT 
He 
205 


TTA 
Leu 


11009 


TTG 
Leu 


GAT 
Asp 


AAA 

Lys 


GAG 
Glu 
210 


GAA 
Glu 


AGA 
Arg 


AGA 
Arg 


GTA 
Val 


GGT 
Gly 
215 


AAG 
Lys 


TCT 
Ser 


TAT 
Tyr 


TTT 
Phe 


TCA 

Ser 
220 


TCT 
Ser 


AGT 
Ser 


11057 


TTA 
Leu 


ATA 
lie 


CCA 
Pro 
225 


GAT 
Asp 


GAA 

Glu 


TGT 

Cys 


TAT 
Tyr 


TTT 
Phe 
230 


CAA 
Gin 


ACG 
Thr 


TTT 
Phe 


GCT 
Ala 


ATG 
Met 
235 


ATA 
He 


AAA 

Lys 


AAA 

Lys 


11105 


GTT 
Val 


GAA 
Glu 


ATT 
He 


TAT 
Tyr 


CAA 
Gin 


CAG 
Gin 


AAA 

Lys 

245 


AAT 
Asn 


ATG 
Met 


TCA 
Ser 


GCA 
Ala 


CGC 
Arg 
250 


TTA 
Leu 


ATT 
He 


GAT 
Asp 


TGG 
Trp 


11153 


ACA 
Thr 
255 


AGA 
Arg 


GGG 
Gly 


AAA 
Lys 


CCA 
Pro 


TAT 
Tyr 
260 


ATT 
He 


TGG 
Trp 


CGA 
Arg 


CAG 
Gin 


GAT 
Asp 
265 


GAT 
Asp 


TTT 
Phe 


TTT 
Phe 


GAA 
Glu 


ATT 

He 

270 


11201 


ATG 
Met 

GAT 
Asp 


AAT 
Asn 

CGT 
Arg 


GAT 
Asp 

AAA 

Lys 


AAA 
Lys 

ATA 
He 
290 


GAT 
Asp 
275 
ATT 
He 


TCA 
Ser 

GAA 

Glu 


ATG 
Met 

GAA 

Glu 


TTT 
Phe 

ATT 

He 


TCT 
Ser 

TAT 
Tyr 
295 


AGG 
Arg 
280 
ATA 

He 


AAG 
Lys 

AAA 
Lys 


TTT 
Phe 

ATA 
He 


GAT 
Asp 

AGA 
Arg 


GAA 

Glu 

GGA 
Gly 
300 


AAT 

Asn 
285 
AGA 
Arg 


GTA 

Val 

AGT 
Ser 


11249 
11297 


ACT 
Thr 


GAT 
Asp 


GAA 
Glu 
305 


GCA 
Ala 


AAT 
Asn 


AAA 
Lys 


ATC 
He 


AAA 
Lys 
310 


GAT 
Asp 


AAG 
Lys 


AGA 
Arg 


TTT 
Phe 


ACA 
Thr 
315 


AAA 
Lys 






11339 



TAATTTTACC TATGTTTTTG GAAAGAAAAC TTTTCTTGGA AGGGGAGAAG CGATTATCAT 11399 
AGATGAACCT GAGCATGGAA ATTTGGGAGA TCAAQCAATT GCTTTTGCAG AAAATCAATT 11459 
TTTAGTAAAT CATGTATCAG TACGAGATGT AGAACATCTT ATAGAAAGCA AAACTATTTC 11519 
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10 



15 



20 



25 



30 



35 



45 



50 



AGAAATAAAA 


TCTATAAAAA 


AAAATATTGG 


AAAAAAAGAA 


TTAGTTTTTT 


TTCATGGGGG 


11579 


AGGAAATTTC 


GGGACACTTT 


ATCTAAAGTA 


TGAGCGCATT 


AGAAGATTGG 


CAGTATCAAA 


11639 


GCTTCCCTTT 


AATAAAATGA 


TTCTATTTCC 


TCAGTCAATT 


TCATTTGAAG 


ATAGTAGGTT 


11699 


TGGTCAGAAG 


CAGCTGAATA 


AAAGTAAAAA 


AATATACAGT 


CAAAATACAA 


ATTTTATTTT 


11759 


GACTGCAAGA 


GAACCAAAAT 


CTTATGGTTT 


AATGAAGAAA 


TGTTTTCCAT 


ATAACAAAGT 


11819 


AAT C TTG ACA 


CCGGATATCG 


TGCTCTCATT 


TAAATTTGAA 


GTCACCATTT 


CTGATACGCA 


11879 


TATTGGGAAA 


GAAAAGGATA 


GTGTTATAAC 


TTATGAAAAT 


CGTCAACACT 


ATCTTGAGAT 


11939 


AAAGTGGGAT 


GAAATTGCGC 


AGCATGAGGT 


CGCCTTAACT 


GATAGATTAC 


ATGGTATGAT 


11999 


TTTTTCATAT 


ATCACAGGCA 


CACCATGTGT 


TGTTTTGGCT 


AATAATAATC 


ATAAAATTGA 


12059 


AGGAACATAC 


AAACATTGGT 


TGAATGAAGT 


CAACTATATT 


CGTTTTATTG 


AAAATCCGAC 


12119 


TGTTGAAAAT 


ATTTTAGATG 


CAATCAATGA 


CTTAAAGCAA ATCGAACCTC 


ACTATATTGA 


12179 


TTTATCTGAT 


AAATTTCAAC 


CACTAATTGA 


TGCGATAAAA 


GGGTAAAGGT 


TTA ATG 


12235 



Met 
l 

AAT AAA TAT AAA AAA CTA CTA TCC AAC TCT CTT GTT TTC ACG ATA GGA 12283 
Asn Lys Tyr Lys Lys Leu Leu Ser Asn Ser Leu Val Phe Thr lie Gly 
5 10 15 

AAC TTA GGC AGC AAA CTG TTA GTC TTT TTA CTC GTA CCG CTC TAC ACC 12331 
Asn Leu Gly Ser Lys Leu Leu Val Phe Leu Leu Val Pro Leu Tyr Thr 
20 25 30 

TAT GCG ATG ACA CCG CAA GAG TAT GGT ATG GCA GAC TTA TAT CAA ACA 12379 
Tyr Ala Met Thr Pro Gin Glu Tyr Gly Met Ala Asp Leu Tyr Gin Thr 
35 40 45 

ACA GCA AAT CTA CTT TTG CCA TTA ATT ACA ATG AAT GTA TTT GAT GCA 12427 
Thr Ala Asn Leu Leu Leu Pro Leu lie Thr Met Asn Val Phe Asp Ala 
50 55 60 65 

ACT TTA CGT TTT GCT ATG GAA AAG TCA ATG ACA AAA GAG AGT GTG TTA 12475 
Thr Leu Arg Phe Ala Met Glu Lys Ser Met Thr Lys Glu Ser Val Leu 
70 75 80 

ACA AAT TCT CTT GTG GTT TGG TGT TTT AGC GCG GTG TTC ACT TGT TTG 12523 
Thr Asn Ser Leu Val Val Trp Cys Phe Ser Ala Val Phe Thr Cys Leu 
85 90 95 

GGC GCT TGT ATT ATC TAT GCG TTG AAC TTG AGT AAT AAA TGG TAT TTA 12571 
Gly Ala Cys lie lie Tyr Ala Leu Asn Leu Ser Asn Lys Trp Tyr Leu 
100 105 110 

GCT TTA CTT TTA ACC TTC AAC TTA TTT CAA GGT GGA CAA AGT ATA TTA 12619 
Ala Leu Leu Leu Thr Phe Asn Leu Phe Gin Gly Gly Gin Ser lie Leu 
115 120 125 

AGC CAG TAT GCT AGA GGT ATA GGA AAG TCG AAA ATA TTT GCA GCT GGC 12667 
Ser Gin Tyr Ala Arg Gly lie Gly Lys Ser Lys lie Phe Ala Ala Gly 
130 135 140 145 

GGA GTT ATT TTA ACC TTT TTG ACA GGC GCT TTA AAT ATT CTT TTT TTG 12715 
Gly Val He Leu Thr Phe Leu Thr Gly Ala Leu Asn He Leu Phe Leu 
ISO 155 160 

GTA TAT TTA CCG CTT GGG ATT ACG GGC TAT TTA ATG TCC CTG GTT TTA 12763 
Val Tyr Leu Pro Leu Gly He Thr Gly Tyr Leu Met Ser Leu Val Leu 
165 170 175 

GCG AAT GTA GGT ACG ATT CTA TTT TTT GCT GGC ACA CTT TCC ATT TGG 12811 
Ala Asn Val Gly Thr lie Leu Phe Phe Ala Gly Thr Leu Ser lie Trp 
180 185 190 

AAG GAA ATT AGT TTT AAA ATA ATT GAT AAA AAA CTG ATT TGG CAA ATG 12859 
Lys Glu He Ser Phe Lys He He Asp Lys Lys Leu He Trp Gin Met 
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195 200 205 



5 



15 



25 



35 



45 



CTC 
Leu 
210 


TAT 
Tyr 


TAT 

Tyr 


GCC 
Ala 


TTA 
Leu 


CCT 
Pro 
215 


TTG 
Leu 


ATT 

He 


CCT 
Pro 


AGT 
Ser 


TCC 
Ser 
220 


ATC 
He 


CTG 
Leu 


TGG 
Tro 


TGG 
Tro 


TTA 
Leu 
225 


12907 


CTG 
Leu 


AAT 
Asn 


GCT 
Ala 


TCT 
Ser 


AGT 
Ser 
230 


CGC 
Arg 


TAT 
Tyr 


TTC 
Phe 


GTT 
Val 


TTA 
Leu 
235 


TTC 
Phe 


TTT 
Phe 


TTA 
Leu 


GGA 
Glv 


GCA 
Ala 
240 


GGT 
Gly 


12955 


GCT 
Ala 


AAT 
Asn 


GGT 
Gly 


CTT 
Leu 
245 


TTG 
Leu 


GCG 
Ala 


GTC 
Val 


GCT 
Ala 


ACC 
Thr 
250 


AAA 
Lys 


ATT 
He 


CCA 
Pro 


AGT 
Ser 


ATT 
He 
255 


ATT 
He 


TCC 
Ser 


13003 


ATT 
He 


TTT 
Phe 


AAT 
Asn 
260 


ACG 
Thr 


ATT 
He 


TTT 
Phe 


ACA 
Thr 


CAG 
Gin 
265 


GCG 
Ala 


TGG 
Trp 


CAA 
Gin 


ATT 
He 


TCA 
Ser 
270 


GCC 
Ala 


ATA 
He 


GAA 
Glu 


13051 


GAA 
Glu 


TAT 
Tyr 
275 


GAT 
Asp 


TCT 
Ser 


CAT 
His 


CAA 
Gin 


AAA 
Lys 
280 


TCA 
Ser 


AAA 
Lys 


TAT 
Tyr 


TAT 
Tyr 


TCG 
Ser 
285 


GAT 
ASD 


GTT 
Val 


TTT 
Phe 


CAC 
His 


13099 


TAC 
Tyr 
2 90 


TTA 

Leu 


GCA 
Ala 


ACT 
Thr 


TTT 
Phe 


CTA 
Leu 
295 


TTG 
Leu 


TTA 
Leu 


GGG 
Gly 


ACA 
Thr 


TCA 
Ser 
300 


GCT 
Ala 


TTT 
Phe 


ATG 
Met 


ATT 
He 


GTG 
Val 
305 


13147 


CTT 
Leu 


AAA 
Lys 


CCA 
Pro 


ATT 
He 


GTC 
Val 
310 


GAA 
Glu 


AAA 
Lys 


GTC 
Val 


GTT 
Val 


TCA 
Ser 
315 


AGT 
Ser 


GAC 
Asp 


TAT 
Tyr 


GCA 
Ala 


AGT 
Ser 
320 


TCA 
Ser 


13195 


TGG 
Trp 


CAA 
Gin 


TAT 
Tyr 


GTT 
Val 
325 


CCT 
Pro 


TTC 
Phe 


TTT 
Phe 


ATG 
Met 


TTG 
Leu 
330 


TCG 
Ser 


ATG 
Met 


CTA 
Leu 


TTT 
Phe 


TCC 
Ser 
335 


TCG 
Ser 


TTT 
Phe 


13243 


TCT 
Ser 


GAT 
Asp 


TTT 
Phe 
340 


TTT 
Phe 


GGG 
Gly 


ACT 
Thr 


AAT 
Asn 


TAT 

Tyr 
* 

345 


ATT 
He 


GCG 
Ala 


GCT 
Ala 


AAA 

Lys 


CAA 
Gin 
350 


ACA 
Thr 


AAA 
Lys 


GGC 
Gly 


13291 


GTA 
Val 


TTT 
Phe 
355 


ATG 
Met 


ACA 
Thr 


TCT 

Ser 


ATC 
He 


TAT 
Tyr 
360 


GGT 
Gly 


ACC 
Thr 


ATT 
He 


GTT 
Val 


TGT 
Cys 
365 


GTC 
Val 


TTA 
Leu 


CTC 
Leu 


CAA 
Gin 


13339 


GTG 
Val 
370 


GTG 
Val 


CTG 
Leu 


CTA 
Leu 


CCC 
Pro 


ATC 
He 
375 


ATC 
He 


GGC 
Gly 


TTG 
Leu 


GAT 
Asp 


GGC GCA 
Gly Ala 
380 


GGT 
Glv 


TTA 
Leu 


TCA 
Ser 


GCC 
Ala 
385 


13387 


ATG 
Met 


CTT 
Leu 


GGA 
Gly 


TTT 

Phe 


TTA 
Leu 
390 


ACA 
Thr 


ACG 
Thr 


TTT 
Phe 


TTA 
Leu 


TTG 
Leu 
395 


CGT 
Arg 


GTC 
Val 


AAA 
Lys 


GAT 
Asp 


ACG 
Thr 
400 


CAA 
Gin 


13435 


AAA 
Lys 


TTT 
Phe 


GTG 
Val 


GTG 
Val 
405 


ATT 
He 


CAG 
Gin 


ATT 
He 


AAG 
Lys 


TGG 
Trp 
410 


CGG 
Arg 


ATT 
He 


TTT 
Phe 


ATC 
He 


AGT 

ser 

415 


AAT 
Asn 


TTA 
Leu 


13483 


TTG 
Leu 


ATC 
He 


GTT 
Val 
420 


TTG 
Leu 


GCA 
Ala 


CAA 
Gin 


ATT 

He 


TTA 
Leu 
425 


TGT 
Cys 


TTG 
Leu 


TTT 
Phe 


TAT 
Tyr 


CTA 
Leu 
430 


CCG 
Pro 


AGT 

Ser 


GAA 
Glu 


13531 


TTT 
Phe 

AAT 
Asn 
450 


TTG 
Leu 
435 
CAG 
Gin 


TAT 
Tyr 

CGT 
Arg 


TTT 
Phe 

ACA 
Thr 


GGT 
Gly 

ATT 

He 


CTT 
Leu 

TTA 
Leu 
455 


GCC 
Ala 
440 
TAC 
Tyr 


CTA 
Leu 

ATT 
He 


TTA 
Leu 

ATC 

He 


TTT 
Phe 

ATG 
Met 


TGT 
Cys 

GCG 
Ala 
460 


GGC 
Gly 
445 
CTA 
Leu 


ATG 
Met 

AAA 
Lys 


TTA 
Leu 

ATA 
He 


GTG 
Val 

AAA 
Lys 


GTT 

val 

AAT 
Asn 
465 


13579 
13627 


AAG 
Lys 


ACA 
Thr 


TTT 
Phe 


GGA 
Gly 


ATG 
Met 


AAA 
Lys 


TCC 
Ser 


TCA 
Ser 


TAAAAATAGA CAGGAGGTGT ATCTCGAATG 


13681 



470 

GTATCGAGAT ATATCTCCTG TCTATTTTTA TGATACTTTT GTGTTAGCTC AACTCAACCG 13741 

CCTTTTAATC TCCCAACAAC AATAATACCC AATCAAACAA CCCAAAAAAT TCAAGATAAT 13801 

50 

ATCACTAATG GCAAATGTGC CCAAATAAAA GATAAATTGA ATGGTTTCAA TTACTAAAAG 13861 

AGTGACCAAA CTGACAATGA CAAACTGTTT GAAATCAGTA TTGATACAGT AAAGGCCACC 13921 
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15 



TAAAGGAATG 


AAGTAGATAA 


TATTTAGCAC 


AGCCTCTTGA 


ATCGTTCTGG 


GATCCGCTTT 


13981 


TATAAAGTCA 


AAAGGATTCA 


GTGACATCGC 


CTGAAAATCC 


GTTATTTTAG 


TAAAAAGTAC 


14041 


CATGAATAAC 


AGTAATAAAT 


ACACACTGAA 


AGCAAGATAG 


AGATAAATAA 


CTGAAAAATA 


14101 


TTTGAGGTGA 


TACTGGATAC 


CAAACAACCA 


GATAATCAGC 


GTTAATAAGA 


GTATTAAAGT 


14161 


CAATGTGGTA 


TAGTCAAAGT 


GGTTAATCAA 


CTTAGCCAGG 


CTTTGATAGC 


GAGTGAGAAC 


14221 


GGG CATAATC 


AGCCAAGTAA 


TCGTCGCATA 


ACTCAGGATA 


AATGTGATCA 


ATAAACTGCT 


14281 


GAGGTAGATC 


ATATATTTTC 


GCAACTGTTT 


CTAACTCCTT 


TTCTTGATGA 


GATTAACCCT 


14341 


ATTTTAACAT 


ATTTTAAAAC 


TGTGATGTTT 


TTATGAATTT 


AAAATAAATG 


TTAAAGAAAA 


14401 


TAAAAATTCA 


CCAGTTGGTT 


CTGTTGCAAA 


GTTTTCCAAA 


AAATCTATTT 


TAGTGTAAAA 


14461 


TTGAGAAAAA 


AGACAGAGAG 


GACAGAGTAA 


TGAATTATTT 


TAAAGGCAAA 


CAATTCAAAA 


14521 


AAGACGTCAT 


TATTGTCTCT 


GTTGGTTACT 


ACCTGCGTTA 


CAATCTAAGC 


TATCGTTAAG 


14581 


TTCAGGAATT 


GTTATATGAT 


C 








14602 



20 

(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 4 84 acides amines 

(B) TYPE: acide amin6 

(D) CONFIGURATION: linfiaire 
25 (ii) TYPE DE MOLECULE: prot6ine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2: 

Met Ser Ser Arg Thr Asn Arg Lys Gin Lys His Thr Ser Asn Gly Ser 
15 10 15 



30 



35 



Trp Gly Met Val Asn Val Gly Leu Thr lie Leu Tyr Ala lie Leu Ala 
20 25 30 

Leu Val Leu Leu Phe Thr Met Phe Asn Tyr Asn Phe Leu Ser Phe Arg 
35 40 45 

Phe Leu Asn He He He Thr He Gly Leu Leu Val Val Leu Ala He 
50 55 60 

Ser He Phe Leu Gin Lys Thr Lys Lys Leu Pro Leu Val Thr Thr Val 
65 70 75 80 

Val Leu Val He Phe Ser Leu Val Ser Leu Val Gly He Phe Gly Phe 
85 90 95 

Lys Gin Met He Asp He Thr Asn Arg Met Asn Gin Thr Ala Ala Phe 
40 100 105 110 

Ser Glu Val Glu Met Ser He Val Val Pro Lys Glu Ser Asp He Lys 
115 120 125 



45 



Asp Val Ser Gin Leu Thr Ser Val Gin Ala Pro Thr Lys Val Asp Lys 
130 135 140 

Asn Asn lie Glu He Leu Met Ser Ala Leu Lys Lys Asp Lys Lys Val 
145 150 155 160 

Asp Val Lys Val Asp Asp Val Ala Ser Tyr Gin Glu Ala Tyr Asp Asn 
165 170 175 

Leu Lys Ser Gly Lys Ser Lys Ala Met Val Leu Ser Gly Ser Tyr Ala 
50 180 185 190 

Ser Leu Leu Glu Ser Val Asp Ser Asn Tyr Ala Ser Asn Leu Lys Thr 
195 200 205 
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He Tyr Thr Tyr Lys He Lya Lys Lys Asn Ser Asn Ser Ala Asn Gin 
210 215 220 

Val Asp Ser Arg Val Phe Asn He Tyr He Ser Gly He Asp Thr Tyr 
225 230 235 240 

Gly Pro He Ser Thr Val Ser Arg Ser Asp Val Asn He He Met Thr 
245 250 255 

Val Asn Met Asn Thr His Lys He Leu Leu Thr Thr Thr Pro Arg Asp 
260 265 270 

Ala Tyr Val Lys He Pro Gly Gly Gly Ala Asp Gin Tyr Asp Lys Leu 
275 280 285 

Thr His Ala Gly He Tyr Gly Val Glu Thr Ser Glu Gin Thr Leu Glu 
290 295 300 

Asp Leu Tyr Gly He Lys Leu Asp Tyr Tyr Ala Arg He Asn Phe Thr 
305 310 315 320 

Ser Phe Leu Lys Leu He Asp Gin Leu Gly Gly Val Thr Val His Asn 
325 330 335 

Asp Gin Ala Phe Thr Gin Glu Lys Phe Asp Phe Pro Val Gly Asp He 
340 345 350 

Gin Met Asn Ser Glu Gin Ala Leu Gly Phe Val Arg Glu Arg Tyr Asn 
355 360 365 

Leu Asp Gly Gly Asp Asn Asp Arg Gly Lys Asn Gin Glu Lys Val He 
370 375 380 

Ser Ala He Leu Asn Lys Leu Ala Ser Leu Lys Ser Val Ser Asn Phe 
385 390 395 400 

Thr Ser He Val Asn Asn Leu Gin Asp Ser Val Gin Thr Asn Met Ser 
405 410 415 

Leu Asn Thr He Asn Ala Leu Ala Asn Thr Gin Leu Glu Ser Gly Ser 
420 425 430 

Lys Phe Thr Val Thr Ser Gin Ala Val Thr Gly Thr Gly Ser Thr Gly 
435 440 445 

Gin Leu He Ser Tyr Ala Met Pro Asn Ser Ser Leu Tyr Met Met Lys 
450 455 460 

Leu Asp Asn Ser Ser Val Glu Ser Ala Ser Gin Ala He Lys Lys Leu 
465 470 475 480 

Met Glu Glu Lys 



(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DB LA SEQUENCE: 

(A) LONGUEUR: 243 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 3: 

Val He Asp Val His Ser His He Val Phe Asp Val Asp Asp Gly Pro 
15 10 15 

Glu Thr Leu Glu Glu Ser Leu Asp Leu He Gly Glu Ser Tyr Ala Gin 
20 25 30 

Gly Val Arg Lys He Val Ser Thr Ser His Arg Arg Lys Gly Met Phe 
35 40 45 
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Glu Thr Pro Glu Asp Lys lie Phe Ala Asn Phe Lys Lys Val Lys Ala 
50 55 60 

Glu Ala Glu Ala Leu Tyr Pro Asp Leu Thr He Tyr Tyr Gly Gly Glu 
65 70 75 80 

Leu Tyr Tyr Thr Ser Asp He Val Glu Lys Leu Glu Lys Asn Leu lie 
85 90 95 

Pro Arg Met His Asn Thr Gin Phe Ala Leu He Glu Phe Ser Ala Arg 
100 105 no 

Thr Ser Trp Lys Glu He His Ser Gly Leu Ser Asn Val Leu Arg Ala 
115 120 125 

Gly Val Thr Pro He Val Ala His He Glu Arg Tyr Asp Ala Leu Glu 
130 135 140 

Glu Asn Ala Asp Arg Val Arg Glu He He Asn Met Gly Cys Tyr Thr 
15 145 150 155 160 

Gin Val Asn Ser Ser His Val Leu Lys Pro Lys Leu Phe Gly Asp Lys 
165 170 175 

Asp Lys Val Arg Lys Lys Arg Val Arg Phe Phe Leu Glu Lys Asn Leu 
180 185 190 

Val His Met Val Ala Ser Asp Met His Asn Leu Gly Pro Arg Pro Pro 
195 200 205 

Phe Met Lys Asp Ala Tyr Glu He Val Lys Lys Asn Tyr Gly Ser Lvs 
210 215 220 

Arg Ala Lys Asn Leu Phe He Glu Asn Pro Lys Thr Leu Leu Glu Asn 
25 2 2 5 2 3 0 2 3 5 2 40 

Gin Tyr Leu 



30 (2) INFORMATIONS POUR LA SEQ ID NO: 4: 

ti) CARACTERI S T IQUES DE LA SEQUENCE: 

(A) LONGUEUR: 231 acides amines 

(B) TYPE: acide amin£ 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

35 Met Asn Gin Asp Asn Thr Lys Ser Asp Glu He Asp Val Leu Ala Leu 

*-5 10 15 

Leu His Lys Leu Trp Thr Lys Lys Leu Leu He Leu Phe Thr Ala Phe 
20 25 30 

Tyr Phe Ala Val Phe Ser Phe Leu Gly Thr Tyr Phe Phe He Gin Pro 
40 35 40 45 

Thr Tyr Thr Ser Thr Thr Arg He Tyr Val Val Asn Gin Ala Thr Asp 
50 55 60 

Asn Lys Asn Leu Ser Ala Gin Asp Leu Gin Ala Gly Thr Tyr Leu Ala 
65 70 75 80 

45 Asn Asp Tyr Lys Glu He He Ala Ser Asn Asp Val Leu Ser Glu Val 

85 90 95 

He Lys Asp Glu Lys Leu Asn Leu Ser Glu Ala Glu Leu Ser Lys Met 
100 105 110 

Val Ser Val Asn He Pro Thr Asp Thr Arg Leu He Ser He Ser Val 
50 115 120 1 25 

Asn Ala Lys Thr Gly Gin Asp Ala Gin Thr Leu Ala Asn Lys Val Arg 
130 135 140 
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Glu Val Ala Ser Lys Lys lie Lys Lys Val Thr Lys Val Glu Asp Val 
145 150 155 160 

Thr Thr Leu Glu Glu Ala Lys Leu Pro Glu Ser Pro Ser Ser Pro Asn 
165 170 175 

lie Lys Leu Asn Val Leu Leu Gly Ala Val Leu Gly Gly Phe Leu Ala 
180 185 190 

Val Val Gly Val Leu Val Arg Glu lie Leu Asp Asp Arg Val Arg Arg 
195 200 205 

Pro Glu Asp Val Glu Asp Ala Leu Gly Met Thr Leu Leu Gly lie Val 
210 215 220 



Pro Asp Thr Asp Lys lie 
225 230 



(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(AJ LONGUEUR: 249 acides amines 
(B) TYPE: acide amine" 
<D) CONFIGURATION: lineaire 
<ii) TYPE DE MOLECULE: proline 

<xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 

Met Pro Leu Leu Lys Leu Val Lys Ser Lys Val Asp Phe Ala Lys Lys 
15 10 15 

Thr Glu Glu Tyr Tyr Asn Ala He Arg Thr Asn He Gin Phe Ser Gly 
20 25 30 

Ala Gin Met Lys Val He Ala He Ser Ser Val Glu Ala Gly Glu Gly 
35 40 45 

Lys Ser Met He Ser Val Asn Leu Ala He Ser Phe Ala Ser Val Gly 
50 55 60 

Leu Arg Thr Leu Leu He Asp Ala Glu Thr Arg Asn Ser Val Leu Ser 
65 70 75 80 

Gly Thr Phe Lys Ser Asn Glu Pro Tyr Lys Gly Leu Ser Asn Phe Leu 
85 90 95 

Ser Gly Asn Ala Asp Leu Asn Glu Thr He Cys Gin Thr Asp He Ser 
100 105 110 

Gly Leu Asp Val He Ala Ser Gly Pro Val Pro Pro Asn Pro Thr Ser 
115 120 125 

Leu Leu Gin Asn Asp Asn Phe Arg His Leu Met Glu Val Ala Arg Ser 
130 135 140 

Cys Tyr Asp Tyr Val He He Asp Thr Pro Pro Val Gly Leu Val He 
145 150 155 160 

Asp Ala Val He He Ala His Gin Ala Asp Ala Ser Leu Leu Val Thr 
165 170 175 

Glu Ala Gly Lys He Lys Arg Arg Phe Val Thr Lys Ala Val Glu Gin 
180 185 190 

Leu Val Glu Ser Gly Ser Gin Phe Leu Gly Val Val Leu Asn Lys Val 
195 200 205 

Asp Met Thr Val Asp Lys Tyr Gly Phe Tyr Gly Ser Tyr Gly Ser Tyr 
210 215 220 

Gly Glu Tyr Gly Lys Lys Ser Asp Gin Lys Glu Gly His Ser Arg Ala 
225 230 235 240 

His Arg Arg Arg Lys Val Gly Trp Asn 
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245 



(2) INFORMATIONS POUR LA SEQ ID NO- 6- 

(i) CARACTERI ST IQUES DE LA SEQUENCE * 

(A) LONGUEUR: 227 acides amines 

(B) TYPE : acide amine 1 
(D) CONFIGURATION : lin6aire 

(ii) TYPE DE MOLECULE: protSine 
(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 

Met Ser Gin Ala Lys Glu Glu He Ser Asp Val Met Thr Tyr Ser Glu 
1 5 io 15 

Leu Thr Ser His Lys Pro Lys He He Tyr Ser Leu He Lys Arci He 
20 25 30 

Gly Asp He Leu Val Ser Ser He Gly Leu He He Leu He Pro Leu 
35 40 45 

Phe Leu He Val Ala Leu He Met Lys Cys Ser Glu Pro Thr Ala Pro 
50 55 60 

He Phe Phe Ser His He Arg Asn Gly Lys Asn Gly Lys Lys Phe Lys 
65 70 75 80 

Met Tyr Lys Phe Arg Thr Met Cys Gin Asp Ala Glu Ser He Leu Met 
85 90 95 

Lys Asp Thr Glu Leu Phe Ala Lys Phe Lys Ala Asn Gly Tyr Lys Leu 
100 105 lio 

Glu Thr His Glu Asp Pro Arg He Thr Lys He Gly Gly He Leu Arg 
115 120 125 

. Lys Thr Ser He Asp Glu Leu Pro Gin Leu He Asn Val Phe Leu Gly 
130 135 140 

Gin Met Ser Leu Val Gly Pro Arg Pro Leu Pro Asp Arg Glu He He 
145 150 155 160 

Glu Tyr Gly Asp Asn Gin Glu Lys Phe Leu Ser Val Lys Pro Gly Met 
165 170 175 

Thr Gly Trp Trp Gin Val Ser Gly Arg Ser Thr He Gly Tyr Pro Glu 
35 180 185 190 

Arg Cys His Leu Glu Leu Tyr Tyr Val Glu Lys Cys Cys Phe Thr Phe 
195 200 205 

Asp Val Leu He Leu Leu Lys Thr He Gly He Val Leu Lys Ara Val 
210 215 220 
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20 
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Gly Ala Arg 
225 



(2) INFORMATIONS POUR LA SEQ ID NO : 7: 
45 (i) CARACTERISTI QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 319 acides amines 

(B) TYPE: acide aminS 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: p rot Sine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 

50 Met Asn Glu Gin Val Thr Phe He Leu Cys Asp Phe Leu Val Arg Glu 

15 io if 

He Lys Pro Lys Tyr Asp Leu Leu Ala Tyr Gin Phe lie Ser Lys Lys 
20 25 30 
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lie Lys Glu He Lys Pro Asp He Val His Cys His Ser Ser Lys Ala 
35 40 45 

Gly Val He Gly Arg Leu Ala Ala Lys Arg Arg Gly Val Lys Lys He 
50 55 60 

Phe Tyr Thr Pro His Ala Tyr Ser Phe Leu Ala Pro Glu Phe Ser Gly 
65 70 75 80 

Lys Lys Lys Phe Leu Phe Val Gin He Glu Lys Phe Leu Ser Arg Phe 
85 90 95 

Ala Thr Thr Lys He Phe Cys Val Ser He Ala Glu Met Gin Ala Ala 
100 105 110 

Leu Glu Val Asn Leu Asp Lys Thr Asp Lys Phe Gin Val He Tyr Asn 
115 120 125 

Gly Leu Pro Glu He Asp Leu Pro Ser Lys Glu Thr He Arg Ala Gin 
J5 130 135 140 

Leu Gly Leu Glu Lys Ala Ala Val Val He Gly Asn Asn Ala Lys Met 
145 150 155 160 

Ser Glu Gin Lys Asn Pro Met Phe Phe Met Glu He Ala Arg Lys Met 
165 170 175 

20 He Arg Gin Asn Ala Asn Trp His Phe Val Trp Val Gly Asp Gly Gin 

180 185 190 

Leu Met Pro Leu Phe Gin Ser Phe He Lys Gin Asn Gly Leu Glu Gly 
195 200 205 



25 



Asn He His Leu Leu Gly Glu Arg Pro Asp Ser Glu He Val Val Thr 
210 215 220 

Ala Tyr Asp He Phe Leu Thr Thr Ser Gin Tyr Glu Gly Leu Pro Tyr 
225 230 235 240 

Ala Pro He Glu Ala Met Arg Ala Gly Val Pro He Leu Ala Thr Lys 
245 250 255 

30 val Val Gly Asn Ser Glu Leu Val He Glu Gly Lys Asn Gly Tyr Leu 

260 265 270 

He Asp Leu Glu Trp Ser Lys Ser Val Glu Glu Lys Leu Tyr Lys Ala 
275 280 285 



35 



45 



Ala Lys He Asp Ala Gin Met He Lys Ala Asp Phe Arg Gin Arg Phe 
290 295 300 

Ala He Asp Gin He Leu Lys Gin He Glu Thr He Tyr Leu Ala 

305 310 315 



(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 
40 (A) LONGUEUR: 372 acides amines 

(B) TYPE: acide amin6 
(D) CONFIGURATION : lineaire 
(ii) TYPE DE MOLECULE: proline 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 8: 



Met Lys Lys He Ser He Leu His Phe Ser Gin Val Ser Gly Gly Gly 

15 10 15 

Val Glu Lys Tyr He Lys Leu Phe Leu Lys Tyr Ser Asp Val Thr Lys 

20 25 30 

Phe Asn Asn Tyr Leu Val Ala Pro Asn Leu Glu Asn Tyr Asp Glu Phe 

35 40 45 

SO Asn Gly Tyr Leu Lys Met Ser Val Asn Phe Asn Met Glu Gin Thr Phe 

50 55 60 

Ser Pro Leu Lys He Phe Lys Asn val Phe Phe He Arg ser Val Leu 
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65 70 75 80 

Lys Lys He Asn Pro Asp He Val Tyr Leu His Ser Thr Phe Ala Gly 
85 90 95 

5 

Val Val Gly Arg He Ala Ser He Gly Leu Pro Thr Lys Val Val Tyr 
100 105 110 

Asn Pro His Gly Trp Ser Phe Lys Met Asp Asn Ser Tyr Leu Lys Lys 
115 120 125 

Leu He Phe Lys Leu He Glu Phe Ser Leu Ser Phe Leu Thr Asp Lys 
10 130 135 140 

Phe He Leu He Ser Glu Ser Glu Tyr He Leu Ala Asn His He Ser 
145 ISO 155 160 

Phe Asn Lys Ser Lys Phe Ser Leu He Asn Asn Gly Val Glu Val He 
165 170 175 

Thr Gly Asp Ser Arg Asn Glu He Glu Glu He Phe Pro Asn Glu Asp 
180 185 190 

Phe He He Gly Met Val Gly Arg Leu Ser Pro Pro Lys Glu Phe Phe 
195 200 205 

Phe Phe He Asp Phe Ala Lys Lys He Leu Gin He Arg Asn Asp Thr 
210 215 220 

Asn Phe He He Val Gly Asp Gly Glu Leu Arg Ser Glu He Glu Arg 
225 230 235 240 

Met He Leu Asp Asn Gly Leu Gly Asp Lys He Tyr He Thr Gly Trp 
245 250 255 

Val Asp Asn Pro Arg Asn Tyr He Glu Lys Phe Asp Gin Ala lie Leu 
260 265 270 

Phe Ser Arg Trp Glu Gly Leu Ser Leu Thr He Ala Glu Tyr Met Ser 
275 280 285 

Gin Lys Lys Thr He Leu Ala Thr Asn He Gly Gly He Asn Asp Leu 
290 295 300 

He Thr Asp Gly Glu Thr Gly Met Leu He Glu Val Gly Asp Leu Asn 
305 310 315 320 

Ser Ala Val Ser Lys Ser Phe Glu Leu Arg Asn Asn Lys Glu Val Ser 
325 330 335 

Asn Gin Leu Ala Asn Asn Ala Tyr Asn Lys Val Val Glu Gin Phe Ser 
340 345 350 

He Glu Lys Gin Met Ala Glu He Glu Ser Leu Phe He Glu Met Cys 

355 360 365 

Asn Asn Glu Lys 
370 



15 



20 



25 



30 



35 



40 



(2) INFORMATIONS POUR LA SEQ ID NO: 9: 
45 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 159 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: protSine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 



50 



55 



Met Leu He Leu Lys Leu Lys Phe His Leu Lys Ser Leu Phe Leu Lys 
15 10 15 

Trp He Tyr Arg Leu Leu Tyr Leu Lys Lys Phe Gin Phe Gly Ala Arg 
20 25 30 
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Leu Thr Phe Arg Asp Gly Phe His Leu Leu He Glu Lys Ser Gly Lys 
35 40 45 

Val lie He Gly Asn His Val Phe Phe Asn Asn Phe Cys Ser He Asn 
50 55 60 

Ala Met Leu Ser Val Thr He Gly Asp Asp Cys He Phe Gly Glu Asn 
65 70 75 80 

Val Lys He Tyr Asp His Asn His Cys Tyr Gin Asn Lys Ser Gin Pro 
85 90 95 

lie Ser Lys Gin Gly Phe Ser Thr Ala Ala He Gin He Gly Arg Asn 
100 105 110 

Cys Trp He Gly Ser Gin Val Thr He Leu Lys Gly Val Thr He Gly 
115 120 125 

Asp Asn Ser He He Gly Ala Gly Val Val Val Tyr Gin Asp Val Pro 
15 130 135 140 

Glu Asn Ser He Val Leu Ser Asn Gly Glu He Arg Lys Arg Gly 
145 150 155 



20 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 

(i) CARACTBRISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 324 acides amines 

(B) TYPE: acide aminS 

(D) CONFIGURATION: linSaire 
(ii) TYPE DE MOLECULE: protSine 
25 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 

Met Tyr Leu Lys Ser Leu He Ser He Val He Pro Val Tyr Asn Val 
15 10 15 

Glu Lys Tyr Leu Glu Lys Cys Leu Gin Ser Val Gin Asn Gin Thr Tyr 
20 25 30 

Asn Asn Phe Glu Val He Leu Val Asn Asp Gly Ser Thr Asp Ser Ser 
35 40 45 

Leu Ser He Cys Glu Lys Phe Val Asn Gin Asp Lys Arg Phe Ser Val 
50 55 60 

Phe Ser Lys Glu Asn Gly Gly Met Ser Ser Ala Arg Asn Phe Gly He 
65 70 75 80 

Lys Lys Ala Lys Gly Ser Phe He Thr Phe Val Asp Ser Asp Asp Tyr 
85 90 95 

He Val Lys Asp Tyr Leu Ser His Leu Val Ala Gly lie Lys Ser Glu 
40 100 105 110 

Thr Ser He Val Cys Ser Lys Phe Phe Leu Val Asp Glu Lys Gly Ser 
115 120 125 



30 



35 



45 



Leu Leu Thr Lys Lys Glu Ala Pro Lys Lys Lys Ser Glu Val Val Ser 
130 135 140 

He Glu Glu Ser He Lys He Leu Leu Leu Gin Gin Asn Gly Tyr Asp 
145 150 155 160 

Leu Ala Val Trp Gly Lys Leu Tyr Pro Val Ser Phe Phe Glu Thr lie 
165 170 175 

Ser Phe Pro Glu Gly Lys Leu Tyr Glu Asp Met Gly Thr Thr Tyr Lys 

50 1 80 1 85 190 

Leu Leu Lys Leu Ala Ser Glu Val Val Phe Leu Asp Ala Tyr Asp Tyr 
195 200 205 
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Ala Tyr Val Gin Arg Pro Asn Ser He Met Asn Ser Ser Phe Asn Leu 
210 215 220 

Lys Lys Leu Asp He He Glu Met Val His Glu Met Glu Asn Asp He 
225 230 235 240 

Leu Ala Gin Phe Pro Asn Leu Ala Leu Tyr Val Lys Asn Arg Ala Phe 
245 250 255 

Ala Ala Glu Val Lys He Phe Leu Glu He Pro Lys Glu Lys Glu Phe 
260 265 270 

Glu Gin Ala Gin Lys Gin Leu Trp His Asp He Lys Lys Asn Arg Lys 
275 280 285 

Ala Pro Phe Met Thr Lys Gly Ala Arg Leu Lys Asn Arg Leu Gly Ala 
290 295 300 

Ser Leu Ser Phe Leu Gly Lys Ser Leu Phe Leu Thr He Gly Lys Gin 
305 310 315 320 

Leu Val Asp Arg 



(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 360 acides amine3 

(B) TYPE : acide amin€ 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 

Met Val He Tyr Phe Leu Leu Phe Pro Met He Ala Met He Tyr Leu 
1 5 .10 15 

Met Thr Leu Leu Leu Arg Gin Lys Ala Gin He Gin Lys Thr He Phe 
20 25 30 

Cys Val Leu Thr Phe Gly Thr Leu Gly Phe He Ser Ala Ser Arg Ala 
35 40 45 

Ser Ser Val Gly Thr Asp Val Thr Leu Tyr Glu Asn He Phe Lys Ser 
50 55 60 

He Asn Tyr Gly He Ser Ala Glu Asn Asn Trp Gly Tyr Val He Tyr 
65 70 75 80 



Asn Lys Leu He Gly Ser Val Phe Gly Tyr Thr Gly His Glu He Thr 
85 90 95 

Ala Ala Asn Ser Val Leu He Thr He Leu He Gly He Phe He Trp 
100 105 110 

Lys Val Ala Glu His Tyr Phe Val Ala Thr Phe Leu Tyr He Ser Leu 
115 120 125 

Phe Tyr Tyr Ala Thr Ser Phe Asn He Ser Arg Gin Phe He Ala Met 
130 135 140 

Gly Leu Val Leu Val Ala He Ser Phe Ala Leu Asp Lys Lys Val Met 
145 150 155 160 

Pro Trp Phe He Leu Thr Val Leu Ala Thr Leu Phe His Ala Thr Ala 
165 170 175 

He Val Ala Phe Pro Val Tyr Trp Leu Thr Lys Val His Trp Asp Val 
180 185 190 

Lys Lys Thr Leu Ser He Phe Pro He Thr He Phe Ala Ser Phe He 
195 200 205 
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Phe Asp Ala lie Leu Asn He Phe Val Arg Phe Phe Pro His Tyx Glu 
210 215 220 

Met Tyr He Thr Gly Thr Gin Phe Asn He Ser Asp Gin Gly Gin Gly 
225 230 235 240 

Arg Val Val Leu Val Lys He Phe He Leu Leu lie Leu Phe Thr Leu 
245 250 255 

Phe Leu Phe Tyr Lys Lys Ser Tyr Ala Leu He Ser Glu Cys His Gin 
260 265 270 

Ser Leu He Ala Leu Thr Thr Val Gly Leu Ser lie Gly He Val Phe 
275 280 285 

Tyr Asn Asn He Leu Leu Asn Arg He Glu Met Phe Tyr Ser He Leu 
290 295 300 

Ser He Val Phe He Pro He Ala He Asp Tyr He Ser Leu Lys Phe 
305 310 315 320 

Lys Gin Lys Asp Ala Val Arg Leu Met Leu Thr He Gly He Leu Leu 
325 330 335 

He Thr Leu Val Pro Tyr Tyr He Gin Val Ser Gly Asn Tyr Ser Gly 
340 345 350 

He Leu Pro Tyr Val He Gin Gin 
355 360 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 316 acides amines 
<B) TYPE: acide aminS 
(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE : protSine 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 

Met Glu Asp Arg Lys Lys Gin Val He Leu He Leu Ser His Arg Asn 
15 10 15 

Thr Leu Ala Leu Lys Ser Thr He Glu Leu Leu Asp Ser Gin Tyr Phe 
20 25 30 

Asp Phe Phe Leu His He Asp Lys Lys Ser Arg He Gin Asp Phe Phe 
35 40 45 

Tyr Leu Lys Lys He Thr Lys Phe Ser Thr lie His Phe Ser Glu Arg 
50 55 60 

Lys Asn Val His Trp Gly Gly Phe Ser Met Val Glu Ala Met Phe Ala 
65 70 75 60 

Leu Leu Glu Cys Ala Arg Asp Thr Gly Glu Tyr Ser Tyr Phe His Phe 
85 90 95 

Leu Ser Gly Asp Asp Met Pro He Lys Asp Asn Glu He Val Phe Asn 
100 105 110 

Phe Phe Glu Asn Ser Tyr Pro Lys Asn Phe He Asp He Leu Asp Phe 
115 120 125 

Glu Asn Val Asn Lys Asn Ser Tyr Phe Tyr Glu Pro Pro Glu Met lie 
130 135 140 

Glu Glu Arg Val Lys Tyr Tyr Tyr Pro His Met Asp He Leu Asn Arg 
145 150 155 160 

Lys Gly Thr Asn Phe He Gly Lys Lys Leu He Tyr Leu Gin Lys Leu 
165 170 175 

Leu Lys Val Asn Arg Leu Lys Asn Arg Glu He Glu He Phe Lys Gly 
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His Gin 

Lys Glu 
210 

Pro Asp 
225 

He Tyr 
Gly Lys 
Asp Lys 



Lys He 
290 

Glu Ala 
305 



180 

Trp Cys Ser 
195 

Glu Arg Arg 

Glu Cys Tyr 

Gin Gin Lys 
245 

Pro Tyr He 
260 

Asp Ser Met 
275 

He Glu Glu 
Asn Lys He 



Leu Thr 

Val Gly 
215 

Phe Gin 
230 

Asn Met 
Trp Arg 
Phe Ser 



He Tyr- 
295 

Lys Asp 
310 



185 

Asn Gin Phe 
200 

Lys Ser Tyr 

Thr Phe Ala 

Ser Ala Arg 
250 

Gin Asp Asp 
265 

Arg Lys Phe 
280 

He Lys He 
Lys Arg Phe 



Val Asp He 
205 

Phe Ser Ser 
220 

Met He Lys 
235 

Leu He Asp 
Phe Phe Glu 



Asp Glu Asn 
285 

Arg Gly Arg 
300 

Thr Lys 
315 



190 

Leu Leu Asp 

Ser Leu He 

Lys Val Glu 
240 

Trp Thr Arg 
255 

He Met Asn 
270 

Val Asp Arg 
Ser Thr Asp 



(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

<i) CARACTER I S T I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 473 acides amines 

(B) TYPE: acide aminS 

(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE : proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 

Met Asn Lys Tyr Lys Lys Leu Leu Ser Asn Ser Leu Val Phe Thr He 
1 5 io 15 

Gly Asn Leu Gly Ser Lys Leu Leu Val Phe Leu Leu Val Pro Leu Tvr 
20 25 30 

Thr Tyr Ala Met Thr Pro Gin Glu Tyr Gly Met Ala Asp Leu Tyr Gin 
35 40 45 

Thr Thr Ala Asn Leu Leu Leu Pro Leu He Thr Met Asn Val Phe Asp 
50 55 60 

Ala Thr Leu Arg Phe Ala Met Glu Lys Ser Met Thr Lys Glu Ser Val 
65 70 75 80 

Leu Thr Asn Ser Leu Val Val Trp Cys Phe Ser Ala Val Phe Thr Cys 
85 90 95 

Leu Gly Ala Cys He He Tyr Ala Leu Asn Leu Ser Asn Lys Trp Tyr 
100 105 no 

Leu Ala Leu Leu Leu Thr Phe Asn Leu Phe Gin Gly Gly Gin Ser He 
115 120 125 

Leu Ser Gin Tyr Ala Arg Gly He Gly Lys Ser Lys He Phe Ala Ala 
130 135 140 

Gly Gly Val He Leu Thr Phe Leu Thr Gly Ala Leu Asn He Leu Fhe 
145 150 155 160 

Leu Val Tyr Leu Pro Leu Gly He Thr Gly Tyr Leu Met Ser Leu Val 
165 170 175 

Leu Ala Asn Val Gly Thr He Leu Phe Phe Ala Gly Thr Leu Ser He 
180 185 190 

Trp Lys Glu He Ser Phe Lys He He Asp Lys Lys Leu He Trp Gin 
195 200 205 
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Met Leu Tyr Tyr Ala Leu Pro Leu lie Pro Ser Ser lie Leu Trp Trp 
210 215 220 

Leu Leu Asn Ala Ser Ser Arg Tyr Phe Val Leu Phe Phe Leu Gly Ala 
225 230 235 240 

Gly Ala Asn Gly Leu Leu Ala Val Ala Thr Lys lie Pro Ser lie lie 
245 250 255 

Ser lie Phe Asn Thr He Phe Thr Gin Ala Trp Gin He Ser Ala He 
260 265 270 

Glu Glu Tyr Asp Ser His Gin Lys Ser Lys Tyr Tyr Ser Asp Val Phe 
275 280 285 

His Tyr Leu Ala Thr Phe Leu. Leu Leu Gly Thr Ser Ala Phe Met He 
290 295 300 

Val Leu Lys Pro He Val Glu Lys Val Val Ser Ser Asp Tyr Ala Ser 
15 305 310 315 320 

Ser Trp Gin Tyr Val Pro Phe Phe Met Leu Ser Met Leu Phe Ser Ser 
325 330 335 
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25 



30 



35 



40 



45 



50 



55 



Phe Ser Asp Phe Phe Gly Thr Asn Tyr He Ala Ala Lye Gin Thr Lys 
340 345 350 

Gly Val Phe Met Thr Ser He Tyr Gly Thr He Val Cys Val Leu Leu 
355 360 365 

Gin Val Val Leu Leu Pro He He Gly Leu Asp Gly Ala Gly Leu Ser 
370 375 380 

Ala Met Leu Gly Phe Leu Thr Thr Phe Leu Leu Arg Val Lys Asp Thr 
385 390 395 400 

Gin Lys Phe Val Val lie Gin He Lys Trp Arg He Phe He Ser Asn 
405 410 415 

Leu Leu He Val Leu Ala Gin He Leu Cys Leu Phe Tyr Leu Pro Ser 
420 425 430 

Glu Phe Leu Tyr Phe Gly Leu Ala Leu Leu Phe Cys Gly Met Leu Val 
435 440 445 

Val Asn Gin Arg Thr He Leu Tyr He He Met Ala Leu Lys He Lys 
450 455 460 

Asn Lys Thr Phe Gly Met Lys Ser Ser 
465 470 



(2) INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 307 acides amines 

(B) TYPE: acide amin£ 

(C) NOMBRB DE BRINS : simple 

(D) CONFIGURATION: linealre 
(ii) TYPE DE MOLECULE: peptide 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 

Met Lys Gin He Lys Ser Lys He Arg Asp Leu Gin Asn Asn Phe Thr 
15 10 15 

Tyr Val Phe Gly Lys Lys Thr Phe Leu Gly Arg Gly Glu Ala He He 
20 25 30 

He Asp Glu Pro Glu His Gly Asn Leu Gly Asp Gin Ala He Ala Phe 
35 40 45 

Ala Glu Asn Gin Phe Leu Val Asn His Val Ser Val Arg Asp Val Glu 
50 55 60 
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His Leu lie Glu Ser Lys Thr He Ser Glu He Lys Ser lie Lys Lys 
65 70 75 80 

Asn He Gly Lys Lys Glu Leu Val Phe Phe His Gly Gly Gly Asn Phe 
5 85 90 95 

Gly Thr Leu Tyr Leu Lys Tyr Glu Arg He Arg Arg Leu Ala Val Ser 
100 105 110 

Lys Leu Pro Phe Asn Lys Met He Leu Phe Pro Gin Ser He Ser Phe 
115 120 125 

Glu Asp Ser Arg Phe Gly Gin Lys Gin Leu Asn Lys Ser Lys Lys He 
130 135 140 

Tyr Ser Gin Asn Thr Asn Phe He Leu Thr Ala Arg Glu Pro Lys Ser 
145 150 155 160 

Tyr Gly Leu Met Lys Lys Cys Phe Pro Tyr Asn Lys Val He Leu Thr 
15 165 170 175 

Pro Asp He Val Leu Ser Phe Lys Phe Glu Val Thr He Ser Asp Thr 
180 185 190 



His He Gly Lys Glu Lya Asp Ser Val He Thr Tyr Glu Asn Arg Gin 
195 200 205 

His Tyr Leu Glu He Lys Trp Asp Glu He Ala Gin His Glu Val Ala 
210 215 220 

Leu Thr Asp Arg Leu His Gly Met He Phe Ser Tyr He Thr Gly Thr 
225 230 235 240 

Pro Cys Val Val Leu Ala Asn Asn Asn His Lys He Glu Gly Thr Tyr 
245 250 255 

Lys His Trp Leu Asn Glu Val Asn Tyr He Arg Phe He Glu Asn Pro 
260 265 270 

Thr Val Glu Asn He Leu Asp Ala He Asn Asp Leu Lys Gin He Glu 
275 280 285 

Pro His Tyr He Asp Leu Ser Asp Lys Phe Gin Pro Leu He Asp Ala 
290 295 300 

He Lys Gly 
305 

(2) INFORMATIONS POUR LA SEQ ID NO: IS: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 32 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineal re 

(ii) TYPE DB MOLECULE: Autre acide nucl,ique 

(A) DESCRIPTION: /desc = "oligonuceotide" 
40 <xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 

GTTGCGGCCG CGATAAAGTG TGATAAGTCC AG 32 
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30 



35 



(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 30 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl6ique 
50 (A) DESCRIPTION: /desc = "oligonucleotide" 

(xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 16: 

ATAGCGGCCG CTTAGCTCAT GTTGATGCGG 30 
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(2) INFORMATIONS POOR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl,igue 

(A) DESCRIPTION: /desc * "oligonucleotide" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 

CCTGCGGCCG CGCTTCCTAA TTCTGTAATC G 31 



(2) INFORMATIONS POUR LA SEQ ID NO: 18: 
,5 (i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

(C> NOMBRE DE BR INS : simple 
(D) CONFIGURATION: lineaire 
(ii) TYPE DE MOLECULE: Autre acide nucl,ique 

(A) DESCRIPTION: /desc » "oligonucleotide" 

20 (xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 18: 

CTGGCGGCCG CTACTTCACG TTTCTTTGCA T 31 



(2) INFORMATIONS POUR LA SEQ ID NO: 19: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 31 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: Autre acide nucl,ique 

(A) DESCRIPTION: /desc = "oligonucleotide" 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 19: 

TACGCGGCCG CACATAGAAT AAGGCTTTAC G 31 



Revendlcatlons 

40 

1 . ADN d'origine chromosomique de bacterie I act que codarrt pour au moins une enzyme impliquee dans la biosyn- 
these de I'EPS presentant la structure repetee 



45 



50 



-> x)-A-<l -> x)-A-(l ->x>A-(l -> 

y 

I 

1 

A 



J n, 



ou n > 1 ; A est choisi dans le groupe form§ par p-D-Galp, p-D-Glcp et leurs derives ac6tyl et phosphatyl; et x et y 
55 = 2, 3, 4, 5 ou 6 sachant que x * y. 

2. ADN selon la revendication 1 , codant pour au moins une enzyme impliquee dans la biosynthese de I'EPS presen- 
tant la structure repetee 
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->3)-[MM3alp( 1 »>3>P-D-Glcp( I »>3)-(i-D-GalpNAc( 1 -> 

6 



(3-D-Gal/? 



3. ADN selon la revendication 1 , comprenant !a sequence nucieique SEQ ID NO:1 . 

4. ADN selon la revendication 2 comprenant au moins un g6ne choisi dans le groupe de genes deiimites dans la 
sequence nucieique SEQ ID NO:1 par les nucleotides 352-1803, 1807-2535. 2547-3239, 3249-3995, 4051-4731, 
4898-5854, 6425-7540, 7736-8212, 8221-9192, 9285-10364, 10392-1 1339, 1 1302-12222, et 12233-13651. 

5. ADN selon la revendication 2, qui est homologue ou qui s'hybride k un ADN selon Tune des revendications 3 et 4. 

6. Vecteur recombinant comprenant un ADN selon Tune des revendications 1 k 5. 

7. Proteine susceptible d'etre impliquSe dans la biosynthese de I'EPS presentant la structure repetee 

->3)-p-D-Galp(l-->3)-^D-Glcp(l">3)-P-D-Ga]^NAc(l-> 

6 



p -D-Galp 

et ayant la sequence en acides amines choisie dans le groupe forme par les sequences SEQ ID NO:2, SEQ ID 
NO:3, SEQ ID NO:4, SEQ ID NO:5, SEQ ID NO:6, SEQ ID NO:7, SEQ ID NO:8, SEQ ID NO:9, SEQ ID NO:10, 
SEQ ID NO:1 1, SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, et les sequences homologues fonctionnelles. 

8. Bacterie lactique comprenant, int6gr6 dans son genome ou par le moyen d'un plasmide r6plicable, un fragment 
d'ADN selon la revendication 1 . 

9. Proc6d6 de production d'un EPS, dans lequel (1) on clone dans un vecteur un fragment d'ADN codant pour les 
enzymes impliquees dans la biosynthese d'un EPS selon la revendication 7, ledit vecteur comprenant en outre une 
sequence permettant la replication autonome ou Integration dans une cellule h6te, (2) on transforme une cellule 
hftte par ledit vecteur, (3) puis on cultive la cellule h6te transformee dans des conditions appropriees pour la pro- 
duction d'un EPS. 

10. Precede selon la revendication 9, dans lequel le vecteur comprend en outre une sequence promoteur et d'activa- 
tion traductionnelle fonctionnels dans ladite cellule hdte. 

11. Proc6d6 de production d'un EPS, dans lequel (1) on clone dans un vecteur un fragment d'ADN codant pour au 
moins une des enzymes impliquees dans la biosynthese d'un EPS, (2) on transforme par ledit vecteur une bacterie 
lactique produisant le cas ech6ant un autre EPS, (3) puis on cultive la bacterie lactique transform6e dans des con- 
ditions appropriees pour la production d'un nouvel EPS. 

12. Procede selon Tune des revendications 9 & 1 1, dans lequel on clone dans un vecteur un fragment d'ADN selon 
Tune des revendications 2 & 5. 

13. Utilisation d'un fragment d'ADN de la sequence SEQ ID NO:1 ou de son brin compiementaire, d'au moins 15pb, 
comme amorce utilisable dans une reaction de PCR ou comme sonde pour detecter in-vitro ou inactiver in-vivo 
des genes de bacteries lactiques impliquees dans la biosynthese d'un EPS. 
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Figure 2 
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